每日热门：一名“佛系”大模型创业者：行业很卷，但我不考虑融资

来源：中国企业家杂志时间：2023-04-12 17:19:12

“员工做错了，我恨不得跟他说5遍，就像用GPT一样一直重复，直到让他理解记住为止。”

文｜《中国企业家》记者孔月昕

(相关资料图)

编辑｜马吉英

头图摄影｜邓攀

与王慧文、王小川、李开复等投身大模型的创业者相比，出门问问创始人、CEO李志飞的身上，缺少了点“明星”光环；但靠着一直以来在AI领域的积累，他在这一波AI创业中“抢跑”了。

曾有友人评价他，“每次都能无比准确地踩在一个点上，并且有备而来。”

2012年10月，李志飞从美国谷歌总部离职后，回国创立了出门问问。彼时，他既没有团队也没有产品，用一个简单的demo打动了红杉资本和真格基金，拿到了1000万元天使轮融资。随后，李志飞在AI创业道路上一路狂奔，5年内完成了五轮融资，项目估值一度高达10亿美元。

在李志飞看来，创业最迷人的地方在于，创业者能够在别人看不到机会和希望的时刻，自己找到一条破题的路。他自己的亲身经历也可以证明这一点，“2015年，在我不知道怎么商业化的时候，我想到了做智能硬件，虽然这条路不一定准确，但在当时看确实是一个surprise；2019、2020年，当别人觉得我们陷入智能硬件的‘坑’里出不来时，我又借助SaaS服务扩大了营收规模；2020年，我们有意无意地投入了生成式AI，并尝试商业化，为大模型研发打下了基础。”

在数次“化险为夷”背后，李志飞也几度遭遇打击。在公司经营上，他“栽过急速扩张的跟头”，不得已只能裁员；他也从技术角度对AI的价值产生过困惑；在2020年底就开始做大模型，但又没有选择大力推进……

“AI可以打败世界上最聪明的一类人如围棋手，却学不会连五岁小孩都会的自然语言对话，为什么呢？” 2017年接受《中国企业家》采访时，他称给自己提出过这样的问题。

而ChatGPT的面世，解释了李志飞多年来的困惑，让他无比兴奋，他觉得自己的时代到了。今年2月，在ChatGPT引发科技圈、创投圈讨论热潮的时候，李志飞也表示自己要进行大模型创业，做“中国的OpenAI”。

“未来大模型赛道会非常卷。”3月底，在北京办公室接受《中国企业家》采访时，李志飞预测道，“我认为一两年后，中国至少50家以上公司都会拥有自己的大模型。” 这也带给李志飞更多信心，“大模型的落地是一件长期主义的事情。”在他看来，经过十年发展的出门问问在生成式AI领域，“已经有了技术的积累和应用落地的优势”。

李志飞还透露，4月20日，出门问问AIGC战略发布会将在北京举行，他将携出门问问的自主中文大模型和面向全球创作者的AIGC产品亮相。

以下为李志飞的采访整理，有删节。

世界观被颠覆了

刚刚得知OpenAI做出ChatGPT的消息时，我特别兴奋。

早在10年前，甚至读博士期间，我就已经在思考AI的认知问题，但一直没找到答案。所以当OpenAI的ChatGPT可以自然地进行上下文对话，且随便聊都不会被问倒时，我觉得自己的世界观被颠覆了。

因为它不单单是能在规则和边界很清晰的环境里计算下象棋/围棋的程序，还解决了在我们看来最难的问题——认知，并学会了用自然语言跟人交互。在微软那篇《AGI的火花：GPT-4早期实验》的最新论文里，GPT-4还帮人写了一道很多大学生都做不出的动态规划程序题，我自己看到那道题都想了一会儿。

这些让我成为AGI的无脑支持者的同时，也对ChatGPT和OpenAI产生了巨大的好奇心：ChatGPT到底是怎么做出来的？为什么是OpenAI而不是别人？带着这两个疑问，我在春节后第二天飞往美国，和很多人聊，其中就包括OpenAI的工程师。

聊过之后我发现，ChatGPT不是单纯地靠很多聪明人以及前沿的技术去实现的。在硅谷，天才到处都是，Google Brain更是有超过1000个博士在专门研究AI，而且ChatGPT的底层技术中的Transformer、Instruction Tuning等都是谷歌研发的。

但为什么是OpenAI？我觉得核心是因为他们创造了一个环境，既有top down的规划，高层对AI有足够强的信念，坚持不动摇；又有bottom up的执行，员工可以完美执行这些规划，两种因素叠加造就了OpenAI能够在这一路径上走得长远。并且，从GPT-3开始，OpenAI就得到了正向的反馈，这也鼓励他们在这个方向上不断迭代，越来越强。

来源：视觉中国

这种极度的兴奋感持续了近两个月。不仅是我，前两个月所有人都很急，大家都怕被大浪卷走。

但我现在的心态比前两个月好很多，也冷静得多。ChatGPT并不完美，关于它的落地，有太多问题需要解决，实现AGI是一件长期主义的事情。可能未来5~10年，我都要all in其中。我能做的，就是在理性状态下，把这件事做好，同时也经营好公司。因为训练大模型一直是我们的企业行为，而非我个人，所以在投入上得理性。

在大模型创业上，我们其实早有准备。很多近一年成立的生成式AI的公司，整个团队可能就几十个人，我们公司有几百人。2020年GPT-3刚出来时，我们就开始尝试做大模型，2022年9月ChatGPT还没有问世时，我们已经尝试做大模型的应用落地，当时是被Jasper.AI启发，我觉得内容生成才是最适合GPT-3落地的应用。我当时和团队沟通，不能只做应用，我们一定要夯实自己的大模型能力，于是我们开始重新做长期规划。

很多人听了OpenAI的投入后会产生一种误解，觉得大模型研发训练要10亿美元，但我们做的偏落地，因此我们不见得需要10亿美元。

尽管很多投资人对我的项目感兴趣，但我依然觉得，我们公司有足够的钱去做自己想要做的事情。除非是我自己单独出来做这件事，否则投资人要看的是出门问问整体的状况，包括公司估值、未来故事、商业模式等，这些加起来就会变得很复杂，因此我目前没有考虑融资的事情。

目前国内还没有探索AI能力天花板的充足环境，因此在公司层面，我更多考虑的是AI应用和落地，能够解决真正的问题，AGI变得越平民化越好，这也更适合出门问问现在的状态。

至于AGI未来的形态以及技术的演化，它只是我个人的研究兴趣。毕竟，OpenAI这种能够探索AI能力天花板的公司，在全世界都是凤毛麟角的；复制或重做一个中国的OpenAI，既没有那么大的价值，也没有那么大的概率。

我觉得我们现在的状态是最好的。虽然没有OpenAI的“特种军”，但我有一支“常规军”，包含训练模型、产品研发、商业化等部门，可以跟上技术潮流不断去迭代。我们有几款产品跟生成AI有很大关联。除了语音助手这一拳头产品外，我们还做过很多AIGC产品，比如AI声音平台“魔音工坊”、AI写作平台“奇妙文”、AI绘画平台“言之画”、数字人视频与直播平台“奇妙元”等，能打通从大模型到产品到商业化的商业闭环，且拥有很好的营收规模，这可能在全世界都是独一无二的。

其次，我不会为了融资去给资本讲很多故事，某种程度上迎合资本不可避免地会导致变形，我们有自己的产品和落地场景，这是我们最好的地方。从长期来看，我们的优势在于坚信AI，未来5年时间我们可以为它不停地迭代，然后比较长期地做这件事。

还有一点优势在于，国内AIGC创业CEO里，我能看懂所有的前沿论文，也清楚整个语言模型的发展历程及其理论进化的来龙去脉，我肯定比绝大部分CEO更懂这些东西。

调整力度最大的一年

尽管我现在坚定不移地相信AI，对长期主义保持了乐观心态，但其实几年前我特别悲观。

2020年之前，我没那么信AI，虽然我们是一家AI公司，但我既不坚信这个东西一定能够做得好，也不认为它会给社会带来巨大的价值。有时我甚至会想，“有生之年我都看不到AGI（通用人工智能）了”。

2019年之后，我甚至不想对外发声了，觉得很多时候说话没有意义，既改变不了行业，也改变不了大家对AI的普遍认知，除非能证明自己比别人厉害，否则就是浪费时间。

除了对技术的失望外，2019年也是我和公司发展的一个低谷期。

最初创业时，尤其是2017年前，我一股脑地投入到技术、产品的研发和商业化上，完全不care其他东西。但到了2018年，尤其是2019年后，我感觉自己见到了商业或者说创业的真相，发现想要变成一家赚钱的科技公司，没那么容易。

过往因为AI商业模式的问题，很多营收并不可持续。如果继续投入，只会饮鸩止渴、越陷越深，从而把自己禁锢住。

看到真相后，经慎重考虑，在2019年，我对出门问问进行了一轮大的调整，精简了业务线，放弃部分亏钱的to B项目以及智能硬件等业务。

2020年，我又进行了一轮大的调整，甚至可以说这一年是调整力度最大的一年。幸运的是，由于我们及时地进行业务线调整，有了多出来的人手，一部分产品经理在2020年初开始做AIGC领域的尝试，并积累了AI生成方面的经验。

来源：视觉中国

同时，2020年OpenAI的GPT-3横空出世后带来行业巨变，直接推动了我信仰的转变，让我见到了AGI实现的可能，我也重新燃起了探索AGI的兴趣。

2021年，我在公司内组建了一个十几人团队，拿出不超过一百万美元的算力费用，训练出了一个60亿参数的模型。由于当时大家参考的都是GPT-3，对比之下，我们60亿模型的“举一反三”能力很弱，这让我们很绝望，觉得太难了。因此我们直接下了结论，60亿模型根本涌现不出in-context learning（上下文学习）能力。

还有一点，如果要进一步增大参数规模，训练一个千亿级别的规模，就太烧钱了。因为OpenAI，大家都知道了，1750亿参数的模型，训练一次就要400多万美元，而且需要多次训练才有可能成功，这个费用几乎上不封顶。

不仅如此，当时我们也没有找到模型落地的应用形态和商业化方式。我每天带着团队像搞科研一样读论文，这个状态对于一家创业公司来说很奇怪，我们又不是一家科研公司。

现在回想起来，我们当时在应用端挑战“举一反三”的能力完全没必要，甚至可以说是钻牛角尖。如果我们换成后来谷歌在2022年提出的instruction tuning（指令微调）方向研究，效果可能更好。

不过，这也不代表我们的尝试是无用功。至少比起市面上其他大模型创业团队，我们已经部分领先了关于分布式训练框架的选择标准，以及数据标记、团队分工、人才需求等方面的认知。

非典型创业者找到了“第二春”

现在，我们的员工都在为了大模型的发布而加班加点的工作，但某种程度上，我不希望公司（员工）太努力。

这种“反卷”也体现在我们办公地点的选择上。2020年，我们北京的办公室从中关村搬到了西直门附近，减少团队长期在一个固定地点被“一窝端”挖角的可能性。

在此基础上，我们现在采取了极度分布式的办公模式，把员工分散在北京、上海、武汉、深圳、台北、苏州、南京等城市办公。如果这样公司能不“挂掉”，而且能正常产出，我认为这在未来可能有很大的竞争力。

可以说，在中国的创业圈里，我肯定不是一个“正常”的创业者。我有时候会对靠组织、文化、时间拼出来的企业产生质疑。我总觉得搞这些事情会让很多人丧失想象力，或者他们会因此疲于奔命。

我一直以来都是把更多时间花在做事情本身上，这可能是一个缺陷，但我觉得任何公司的成功都没有套路，不要去尝试把自己变得跟别人一模一样。我觉得必须承认人就是人，不是神。每个人包括我，都有自己的兴趣爱好，我就是对做事情本身更加感兴趣，我愿意花更多时间在事情上，我对组织、文化就是没那么“感冒”，而且某种程度上我是反对这些东西的。

我把自己的这种状态归结于偏向硅谷。因为我希望能够用高度分布式的、某种程度上算作躺平式的管理方式来做出创新，在这种状态下，偶尔加班可以做得更好。我觉得硅谷很多公司，尤其是创业公司都如此。

摄影：邓攀

如果在硅谷仔细观察，大家就会发现硅谷绝对是躺平的：躺得妥妥的，员工都不去上班。Facebook的员工为什么还去上班？是因为他们大部分是想去公司充电、吃午餐。

尽管他们都不上班，但这一个多月以来美国科技公司产出的东西依然让人眼花缭乱，每个公司都是如此。我认为这也证明了组织力或者“好拼好努力”的文化，不见得能搞出最顶尖的创新。

我觉得现在国内太喜欢把事情模式化或者格式化，但公司的成功有不同的原因，如果我们这样（佛系）的公司也能成功，我觉得对于国内来说也是很大的进步。

因此，我一直对公司文化没那么敏感，而且过去我也不喜欢组织，我甚至都不愿意去讨论它。

但这次OpenAI的组织，真的太令我好奇了，为什么它能搞出来（GPT）？这确实是一个问题，在中国创业要做得很成功，可能还是要在组织、文化上花很多精力。

在公司管理上，我认为就是找到适合自己的方式，即用事情来驱动人，比如说我会给员工找一些有意思的事情，然后让他在事情中去成长，而不是说跟员工谈心。

我不是那种能够给员工鼓励打鸡血式的领导者。在我看来，错的就是错的。员工做错了，我恨不得跟他说5遍，就像用GPT一样一直重复，直到让他理解记住为止。

对于出门问问的未来，我觉得信心比两三年前强很多，很多时候一个公司能不能做大或者做成什么样，除了自己努力外，也取决于时代趋势。我觉得我们正在一个很好的趋势上。我们现在好像找到了“第二春”，而且都提前布局好了，对未来的发展，我的预期是：上不设限。

标签：

热点排行