您的位置 首页 > AI技术

有人已经通过AI月入十万

2024年,如果你还不会使用AI,那么你可能已经落后时代一个身位了。

随手打开任何一个你经常使用的大厂开发的软件或者工具,你可能会惊讶地发现,那些我们已经习以为常的工具和软件,都已经纷纷接入了AI能力。

有人已经通过AI月入十万

没错,AI已经完整地覆盖了我们工作和生活的各个层面。我最早关注的一批研究AI工具的先行者,已经开始在各大AI论坛担任专家和导师的角色了,而单单是我目所能及的,自媒体领域的很多人,已经开始使用AI为自己打工,开始利用AI赚钱了。

但是当我问及身边的朋友,却发现仍然有很多人还不知道怎么使用AI工具。

因此,我决定把目前自己常用的一些AI工具,跟大家分享一下。

这些工具基本都是由大厂开发, 靠谱程度请尽管放心,我基本上只用最好用的。在付费方面更不用担心,我推荐的这些基本都是大厂出品的免费或开源产品,即使付费,也是相当便宜合理的价格。

Kimi chat

Kimi.ai是我目前用的最顺手的一款AI工具网站,这款工具开发团队正是当前国内AI领域的当红炸子鸡:据说已经完成10亿美元融资的月之暗面。

月之暗面创始人杨植麟的背景相当耀眼,90后已经是清华大学交叉信息学院的助理教授,本科毕业于清华大学,而后在卡耐基梅隆大学读博时师从苹果AI研究负责人Ruslan Salakhutdinov等,在AI领域具有广泛的学术影响力。

我选择Kimi chat的主要原因还是因为它实在太好用了。界面简单,交互非常人性化,具备显著的中文优势,能够为用户提供回答问题、速读文件、整理资料、激发灵感、辅助创作等服务。

目前在我这里,Kimi基本已经替代了所有的国产搜索引擎。

客观来说,有时候Kimi出来的结果没有chatGPT效果好,但在中文AI助手工具当中已经是佼佼者。Kimi能够支持约20万汉字的上下文输入,但是个人实际测试,Kimi的输出一般会保持在1000字上下。除非你对它特别要求,才会输出比较长的文本。

豆包APP

豆包APP是字节跳动推出的一款集成了多种AI功能的智能对话助手,它具备丰富的学科知识,能够准确回答各类问题,同时提供文案创作、高质量图片生成等功能。用户界面直观易用,允许用户选择不同的AI角色进行互动。

豆包内置了编程助手、起名神器、英语学习助手等多种智能体,满足多样化的使用场景。尽管可能存在局限性和准确性问题,但它已经能够满足用户在办公、学习、生活和娱乐方面的多项需求,是一款功能全面、操作简便的AI对话工具。

豆包最为亮点的功能是,它提供了独特的AI语音克隆功能,允许用户通过简单的步骤录制自己的声音样本,从而使AI学习并模仿用户的语音特征。在声音设置中,用户根据系统提示录制一段约30秒的声音,豆包将利用这段录音训练出用户声音的AI模型。

用豆包APP给自己做个声音克隆助理,你就可以拥有自己的专属自媒体配音员,还可以自己给自己打电话,让自己的AI克隆版陪你练习英语口语,不得不说,虽然有点变态,但很好用。

假如你会使用字节跳动的另外一个平台Coze,你就可以自己开发一个属于自己的智能体,发布到豆包和飞书。

Coze(扣子)是一个由字节跳动推出的新一代AI大模型智能体开发平台。这个平台旨在为用户提供一个低门槛、快速搭建个性化或具备商业价值的智能体的环境,并且可以将这些智能体发布到豆包、飞书等多个平台。

另外要说一句,目前coze平台的插件里包含了GPT-4V(大概相当于GPT-4的阉割版),也就是说通过Coze平台,你目前可以制作属于自己的智能体,同时还能白嫖GPT-4的部分功能。

AI手机

虽然说目前手机上的大模型肯定没有电脑端的全能,但是你不得不承认的是,目前手机仍然是绝大多数大模型的入口之一。当前就算是上千亿参数的大模型,不管是文心一言,还是清华智谱,还是Kimi chat,全都得乖乖做自己的APP,去手机上抢占入口,毕竟手机才是大多数人使用时长最多的场景。

具备了自研AI大模型能力的手机,至少在给广大人民群众普及AI玩法上面,已经是完全称得上是功德无量了,毕竟这些AI功能一旦由手机厂商下放到手机上,基本就意味着完全免费。

一加12是目前我在用的手机,最新的系统更新,已经加入了AI大模型,支持AIGC消除、智能通话摘要、AI绘画、AI全能助理等多个功能。其中,会议记录功能和语音转文字功能,可以实现无限文字转写,简直秒杀市面上各种付费的语音转写工具。

这两天一加又发布了一款AI手机:一加Ace3V,各项基本无太大短板的中端高性能配置,高通骁龙7Gen3,虽然比8Gen 3差点,但毕竟也是全球首发,性能小钢炮,至少打游戏无一点压力,跟旗舰一样的 5500mAh的大续航,100W快充,甚至还有IP65级别的防水,再加上从旗舰机型上面下放的AI大模型功能,当然最关键的还是1999元的价格,真的太香了。

这款手机的发布,引爆了AI手机和科技平权的概念,估计接下来一整年,会有更多的平价科技产品搭载AI,也就是说在中国,上到王公贵族下到平民百姓,都将有资格体验到AI手机的便利。

正如一加总裁李杰所说的:"AI手机普及的标志,是让更多人能用上AI 。一加Ace 3V不仅要普及旗舰体验,更要开启一个AI手机普及的时代。"

剪映专业版

剪映专业版现在已经成为我使用频率最高的一款剪辑软件了。作为字节跳动旗下的视频编辑软件,不仅提供传统的视频剪辑功能,还集成了一系列先进的AI技术,极大地丰富了用户的视频创作体验。

其实剪映此前已经加入了一键生成字幕、智能剪口播、语音朗读等相关AI功能,但自从5.4版本之后,剪映又进行了重新的迭代升级,新增了许多最新的AI技能,个人觉得比较实用AI功能有以下几个:

智能剪口播:这个功能其实以前就有,能够分析视频中的语音内容,识别出无效片段(如语气词、重复内容等),并允许用户一键删除这些不需要的部分。但是最新的迭代版本是,智能剪口播功能可以识别视频中的语音内容,并将其转换为文字。这样,用户就可以直接在智能剪口播的界面中,对识别出的文字进行编辑和调整。例如,可以修改错别字、调整语序,或者删除不必要的内容。

也就是说,即使你完全不会剪辑,只要会写字,会删减段落和文字,就可以通过剪映,自己制作一个精炼的口播视频。

智能抠像:剪映的智能抠像现在已经可以做到非常不错的抠像效果,我更推荐你选择其中的自定义抠像,只需要用智能画笔稍微画一下,就可以把选定对象从原背景中分离出来,并将其放置到新的背景视频中,从而创造出独特的视觉效果。

AI语音克隆:用户可以通过录制自己的声音样本,利用AI技术生成具有相似音色的合成语音,用于视频的文本朗读,提供更加个性化的配音选项。

AI绘画:这是一个基于文本描述生成图像的工具,支持动漫、写实、摄影和插画等多种风格,用户可以通过输入描述或使用内置模板快速转换成图像,甚至进行局部重绘和分辨率提升。

图文成片:AI根据用户输入的提示词智能生成视频文案,并自动匹配视频素材、字幕、配音和配乐,简化了视频制作流程。

数字人口播:用户可以创建虚拟的数字人形象,为视频解说配音,提高制作效率并降低成本,适用于多种视频内容和场景需求。

这些AI功能的加入,不仅使得剪映在视频编辑领域更加强大,也为内容创作者提供了前所未有的便捷和创造力。随着AI技术的不断进步,剪映的AI功能也在不断完善和发展,预示着视频创作领域的未来将更加智能化和高效化。

AI绘画:dreamina

字节跳动家的AI绘画工具dreamina,生成的图片版权归你,应该是SD的模型改版的,勉强能当midjourney国内平替版本吧,刚刚问世的那段时间,它直接免费,不限量,太秀了。现在应该是转为了每天送给大家免费额度,后续如果有更大需求需要充值点数的模式。

dreamina的部分功能已经接入了剪映,目前在手机端和电脑端的剪映专业版都能看到AI扩图、AI绘图相关的入口。前两天去英伟达参观,英伟达透露跟剪映有深度合作,估计应该就是AI文生图与文生视频方面的GPU加速合作, 刚好dreamina的首页又进行了改版,新增加了生成视频的入口,目测国产版的文生视频工具已经马上要来了。

AI绘画:6pen.art

2022年,AI绘画工具midjourney和stable diffusion席卷全球,我也用上了国内开发者第一时间推出的国产AI绘画工具,我用的比较顺手的是一个国产工具6pen,因为它有stable diffusion的接口,而且可以自定义分辨率和关键词选项,那段时间时间,往里面充值了不少钱,最多的时候一天画了七八百张图。

事实上直到现在,如果你有更加专业的文生图的需求,我仍然会比较推荐6pen。

因为dreamina这种大厂出品的平台,为了更加大众化,通常做的很傻瓜,这也就意味着你无法调整更加细致的参数,而6pen这种更加注重专业化参数调整的平台就弥补了这一缺陷,同时6pen上面还有模型市场,可以搭载各种开发者自己训练的最新模型,包含各种风格和实用的场景,为AI绘图和设计提供了更多的可能性。

AI文生视频:Stable Video

之前,研发了ChatGPT的那家人工智能公司OpenAI发布了最新“文生视频”大模型Sora,并同时公布了一系列样片,效果细腻逼真,运镜真实,直接震惊了全世界。

但可惜的是,Sora虽好,却只是一个demo展示,短时间内Sora不会向公众开放。因此,与其研究还没发布的sora,不如直接上手玩已经发布的Stable Video。

stablevideo.com是Stability AI推出的文生视频工具网站,能够将静态图像转化为14帧和25帧的视频,帧率可在3到30帧每秒之间自定义,以适应不同的视频需求。在sora发布之前,这应该是目前使用量飙升速度最快的文生视频工具了,界面简单易用,每天提供免费的150积分,用户可以用这些积分生成视频片段,对于轻度用户来说,已经足够使用。而且更贴心的是,支持银联信用卡充值点数。

目前Stable Video支持文生视频和图生视频两种模式。

图生视频的模式是,用户上传一张图片,进行一些设置后,可以直接生成视频。文生视频的原理是先通过文生图,然后再用图生成视频。用户可以输入文本描述,Stable Video会根据描述生成四张图片供用户选择,然后基于选定的图片生成视频。

生成的视频持续时间可达2至5秒,处理时间不超过2分钟,用户可以快速得到高质量的视频内容。

昨天玩了下,感觉效果非常棒,效果如下:

个人使用感受是,与其他主流AI视频工具如Runway、PixVerse、Pika等相比,Stable Video在生成速度和质量方面要更好一些,但一旦涉及到细腻复杂的场景,仍然具有局限性,会出现融合闪烁的情况。

放眼全球,当前在AI视频方面,我们能期待的,除了stable video的更新迭代,应该就是Open AI公司还没发布的Sora,以及AI视频的先行者runway接下来的更新迭代版本,还有就是马上要发布AI文生视频版本的AI绘画王者midjourney了。

国内方面,个人感觉比较有潜力的大概有两家,一个是创始团队中有国内AI视频早期玩家加入的Murphvideo,还有一个就是剪映旗下的文生图工具dreamina即将推出的文生视频版版本。

这两家公司的文生视频大模型应该都是基于当前的开源模型进行的更新迭代,奢求他们依靠开源模型逆向出可以媲美midjouney和sora的生成效果显然是不太现实的,但未来作为物美价廉的国产平替应该还是够用的。

AIGC教程:

关于AI的免费课程,其实网上有很多系统又专业的飞书文档,完全免费。

其中有一个网友分享的AI信息站合集的知识库非常好用,我也复制了一个,大家可以直接复制使用:

其中有一个网友分享的 AI 信息站合集的知识库非常好用,我也复制了一个,大家可以扫码直接复制使用:使用方法:把表格里的内容复制出来,到一个新表格,然后进入知识库浏览目录,根据需要,对表头字段和表格内容进行增删改,然后,就有了属于自己的AI信息站了。

关于Sora,这里推荐另外一个网友的飞书知识库《sora学习手册》,从科学论文到操作指南,专业程度应该超过了市面上的所有付费课程:

最后说一下,如何写出满意的文生图和文生视频关键词:

Sora目前还是一个demo版本,个人认为,文生视频这玩意,一旦大厂出品成免费的工具,基本上你上手就会,你只需要输入关键词,就直接能得到相关的画面。所以没必要四处急着找教程。

最难的部分,无非也就是研究一下怎么写提示词,如果懂点视听语言,会写脚本的话,那写文生图和文生视频的提示词根本不在话下。

在我看来,文生图和文生视频,本质上都是用来详细描述和指导视觉内容创作的文本,包含了故事叙述、描述性语言、重要细节、情感氛围以及创意表达等元素,甚至你可以指定角度和机位,还有镜头焦距以及相机品牌,像极了一个文字版的拍摄脚本。

除此之外,AI工具一般会在画面描述之外,再增加一些艺术家风格、渲染工具、器材、渲染材质等细节上的描述。如“赛博朋克风格”、“印象派画风”或“电影胶片质感”,在提示词中明确指出。

懂了这一点,你基本就掌握了所有类似工具的提示词玩法了。

我曾经在群里说过,保持好奇,可以延缓衰老,所以我一直保持对新鲜事物的好奇心。

现在可以再加上一条:每一个不想被时代丢下的人,请一定要学会使用最新的生产工具。而AI,正是我们这个时代的新质生产力。

马克思说,无产者只有掌握了生产资料,才能够彻底摆脱生存恐惧。

所以不确定性的年代,请务必携带更多的本领上路。



本站涵盖的内容、图片、视频等数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!

Copyright © 2023