最近两个多月,刺猬公社(ID:ciweigongshe)前往上海、杭州、成都、广州等城市拜访了多家公司。一个惊人的事实是,几乎所有公司——不论是做游戏的,还是做直播电商、新消费、教育培训、健身、播客、长短视频的——都在讨论一个共同话题:
以Chat GPT为代表的AIGC,会如何闯入并改变我们所在的行业?取代我的工作,还是给产业带来新的机会?
这个问题,Chat GPT暂时还回答不了。它可能组织一段逻辑通顺的语言,但想要获得更多新知,乃至找寻AIGC创业的参考,还得把目光放在大厂之外的AIGC创新者们。
在AI生成设计、AI生成虚拟人、AI生成音乐和对话式AI等四个AIGC创业的主流领域,刺猬公社对话了四家不同赛道的创业公司。相比Open AI等国内外大厂,我们能看到他们走出了一条完全不一样的道路:
从某种程度上讲,这些AIGC创新者所展现出的产品、商业和公司组织特质,甚至是“反传统互联网”的。
不问出处,都在人工智能创业
2023年2月,一份叫《ChatGPT团队背景研究报告》的文章在AIGC创业圈、投资圈和媒体圈盛传。研究团队针对ChatGPT项目做出贡献的87个成员进行了背景研究,其中,团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。他们的显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”“崇尚创业”和“华人抢眼”。
在以上这些特征中,名校背景以及技术实力夺人眼球,但更重要的是,对于这些人才来说,走前人未走过的路、开拓一个全新领域,是他们最重要的追求之一。这也鲜明的体现在了刺猬公社拜访的四家AIGC创业公司身上,尽管AI浪潮在2022年才正式开始,但这些公司创立的时间要早得多,在AIGC概念尚不清晰的时代,他们就已经开始了努力。
只不过那时的AI创业,没有如今的喝彩与关注。
时间拨回2016年,伴随VR浪潮的起伏,成维忠和创业团队把目光瞄准虚拟人赛道,于是,专攻虚拟人动作和表情生成技术的中科深智诞生了。但在动捕技术与动作表情库剪辑占主流的虚拟人市场,由深层次AI算法驱动虚拟人技术,并没有引起市场足够的重视。成维忠告诉我们,直到现在,国内外市场中使用这项技术的公司也并不多。
这也让公司的早期融资面临着不小的问题。在研发虚拟人驱动技术的过程中,中科深智也采用过动作捕捉与动作表情库剪辑,但成维忠始终认为,这些都不是虚拟人的原生技术,AI算法驱动才是未来最正确的道路。直到创业四年后,公司迎来了第一笔融资,从2020年中到2021年末,中科深智获得了三轮融资,AI道路得以持续。
2022年是个变局,在此之前,AIGC不能算是虚拟人生成领域的最优解,但大模型技术的发展成熟正在改变一切。在此基础上,中科深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许将会发生一场AI革命。
整个行业在“飞跃”,对于几年前的国内AI创业人们来说,这是难以想象的。
同样是2016年,还在清华读博的刘晓光加入了清华大学的一个专攻AI音乐的兴趣小组,这便是新音乐产业公司DeepMusic的前身。DeepMusic最早的目标是帮助音乐爱好者更高效率地创作音乐。但在当时的团队内部,已经萌生了AI基于人的交互生成音乐内容的想法,其实已经很“AIGC”了。
2018年,在刘晓光的带领下,DeepMusic从一个兴趣小组变成了一家科技公司,并拿到了清华系基金和音乐人李健的投资。用AI帮助音乐人创作,乃至AI自主创作音乐,成为了DeepMusic的目标。让刘晓光印象最深刻的是两年之后的2020年,全民K歌找到了他们,希望能够在平台内开发“一键remix”的功能,将已有的音乐伴奏进行风格化改编。
“他们提出的诉求是,一个月做出5万首左右的伴奏。一般来说,一个20人的音乐人团队需要两年左右才能完成。”刘晓光回忆,尽管DeepMusic的AI生成技术已经相对成熟,但并没有产品化,“这个要求是我们产能的10倍。”
这是DeepMusic第一次大规模地应用自己的技术,在建立起了一个流水线化的生产流程后,一个月,他们最终完成了任务,5万首伴奏的通过率达到99%。与中科深智一样,DeepMusic的AI技术同样是应用在企业端的,早期的AIGC创业公司与传统的互联网公司不同,他们不追求直接触达C端,而是以输出技术的方式加持B端,这不仅关于技术能力的发展,更是由市场需求决定的。
直到2022年AI作画兴起,AIGC才真正开始走进C端市场,而DeepMusic一类的创业公司,则在B端更高要求的应用中,不断推进技术的发展。2022年,DeepMusic已经成为了国内头部的AI音乐公司,不仅拥有“配乐猫”“口袋音乐”等创作产品,还与QQ音乐等头部音乐平台展开合作,推出了多个AI音乐系统。
伴随时间的推移,在国内,真正面向更广阔用户,人们触手可及的AI产品也开始出现。计算美学旗下的画宇宙平台正是其中之一。
“从很早开始,我们就觉得人工智能加设计肯定是未来。”计算美学联合创始人赵哲析告诉刺猬公社,在营销场景不断增加的情况下,国内设计人才与设计力仍旧存在短板。想要解决长久以来的供求不平衡,必然需要新技术带来新变革。2020年12月,赵哲析和几个同学一起创办了计算美学,专攻AI设计领域。
他们最先拿出了一款AI生成logo的产品,之后的2022年1月,进阶产品“图宇宙”正式推出,可以在AI技术的加持下实时生成海报。在当时的国内市场,AI生成海报的产品仅计算美学一家,2021年末,计算美学也获得了高瓴创投的数千万融资,新的产品也被提上日程。
不同于大多数AI作画平台,计算美学从一开始的目标就是希望利用AI赋能专业设计,2023年初,他们搭建起一个专业级别的智能设计平台——“画宇宙”,能够实现“无限画板”“实时编辑”,在AI的交互和可控方面更进一步。
值得关注的是,无论是计算美学和DeepMusic,他们的创业团队都有着深厚的名校背景。DeepMusic脱胎于清华大学的兴趣小组,核心成员基本都来自清华大学。计算美学同样有着类似的基因,据联合创始人赵哲析的介绍,计算美学的设计团队基本都来自清华大学美术学院,技术方面的成员则基本都来自清华和北大。
国内顶尖高校背景、年轻的研发团队,他们依靠着自身的学术圈层聚集在一起,共同步入了一个未来风口之中。
而在对谈中,几位公司的创始人都提到了团队的一大特点,那就是团队的稳定。“对于很多算法工程师来说,做AIGC不一样,需要很深度的团队协作,在人工智能的团队里,长期投入才能看到成果。”成维忠告诉刺猬公社,AI创业并不简单,无论是研发技术还是产品,都需要长时间的投入。因此,相比于人员变动频繁的互联网行业来说,AI创业公司的技术团队非常稳固,创业几年过去,团队中最早的一批成员仍旧是中流砥柱。
“我们的核心算法团队从来没有变过。”秘塔科技联合创始人、首席运营官王益为告诉刺猬公社,他的另一个身份被更多人熟知:B站知名UP主“王一快”。
在AI创业之前,王一快是一名律师,2018年,他和几位NLP领域的技术专家一起成立了秘塔科技,最早从AI翻译服务切入,并逐步推出文本校对、改写润色等功能服务。秘塔科技是国内较早利用大语言模型技术推动AIGC内容的公司,“我们的技术路线,从2019年开始做写作猫就已经决定了。”
“2018年左右,我们都认为AI理解上下文语境是非常困难的,当时基本都是单轮问答,甚至单轮问答里面也不能设置太长的条件。”依靠对自身语言模型的不断的深度学习训练,2021年末,秘塔科技已经能够实现AI的多轮对话。
2023年,ChatGPT席卷全球;3月,秘塔科技推出了自研AI文本生成产品“对话写作猫”,算得上国内第一批“中文ChatGPT产品”。在实际的体验中,对话写作猫已经能进行流畅的中文连续对话,并且在法律内容领域展现出了一定的优势。
评论列表 (0条)