当下最热门的两个话题,一个是火出圈的ChatGPT,另一个是汽车行业的自动驾驶,这两个看起来关联性不强的行业却又有着千丝万缕的联系。
ChatGPT的出现正在逐渐改变人类获取知识的方式,这毫无疑问会在逐渐成熟之后而影响我们的生产方式,而自动驾驶实际上是影响我们的出行方式,甚至是城市格局,因此从应用效果上两者都可以在空域和时域上提高人类社会的运行效率,从技术的通用性上两者都是数据、算力的集大成者。两个领域有相似性必定带来人才的相互流动,自动驾驶行业的人想进入人工智能行业探索智能,人工智能行业的人想再造自动驾驶让汽车变得聪明。另外在特斯拉汽车的影响下,自动驾驶的技术迭代逐渐向大模型,大算力、大数据方向不断靠近。然而,不断地逼近和等于完全是两回事,例如1+½+⅓+¼……和2在数学理论上是完全不同的。所以通过数据的迭代和模型的参数的提升实现无人驾驶将会是个伪命题,同时也可以证明,在应用领域通过渐进式的路线永远达不到预想中的无人驾驶。
迄今为止深度学习已经经历了3次发展浪潮:
20世纪40年代到60年代,深度学习的雏形出现在控制论
20世纪80年代到90年代,深度学习表现为联结主义
直到2006年,才真正以深度学习之名复兴。
脱胎于深度学习大模型的ChatGPT是人工智能领域突破性的进展,可以大大提高以往机器学习的效率,尤其在文字产出方面具有非常高的应用价值,但是AI大模型的出现并不等于社会运行范式的转移。既然是ji基于深度学习的大模型,那么行业内外的企业都可以看到,于是各大互联网公司、半导体公司纷纷投入大量资源进入大模型领域,俨然训练通用大模型成为新一轮科技的军备竞赛,华为的盘古、百度的文心、360的智脑、阿里的通义千问、腾讯的混元等等,除此以外还有一些躬身入局在大模型领域创业的个体。无论是多么花哨的名字,大模型主要有几点,第一海量的数据;第二大规模的算力;第三模型要么针对不同的任务需要调整,代表为谷歌的BERT,要么不用微调直接上手使用,典型的代表ChatGPT。
可以预见的是,在未来,会有更多的自动驾驶公司采用大模型来解决自动驾驶的数据长尾问题,并继续进行高阶版的1+½+⅓+¼……运算。然而,大模型虽然在自动驾驶领域的数据处理方面会产生一定效果,但它并不是迈向无人驾驶的唯一途径。首先,大模型的初衷是利用人类现有的知识体系去探索机器智能的极限,而自动驾驶解决的是人类出行中的不确定性问题,包括认知的不确定性和随机的不确定性。因此,使用不确定的方法理论去解决不确定性的问题,得到的结果仍然是不确定的。其次,尽管大模型可以提高自动驾驶的数据处理效率,但它并不能解决自动驾驶的其他问题,如传感器技术、实时控制算法、地图更新等方面的挑战。因此,需要综合多种技术和方法,才能实现真正意义上的无人驾驶。总之,虽然大模型在某些方面有其优势,但它并不是解决自动驾驶问题的唯一途径。未来,我们需要探索更多的技术和方法,才能让自动驾驶真正走向普及和商业化。
其次是大模型的基础原理创新不足,这一点从ChatGPT火热后国内企业雨后春笋般出现的速度中可以窥见,大家发布的大模型方法大同小异,暴力堆算力提高训练参数量;最后是关键的成本问题,这个不仅仅是金钱的成本,还包括时间和碳排放的成本,羊毛出在羊身上成本的提升无形中提高了自动驾驶研发和使用的门槛。
自动驾驶公司自建大模型需要具备分布式训练、模型蒸馏、部署等等能力,需要的不仅仅是技术理论还有工程能力,除了资金的投入还有相关人才的投入, 最后是将自动驾驶行业的know-how融入到大模型训练的能力。在这个“烧钱”的过程中,首先问题是自动驾驶公司能投入多少资源;其次是自动驾驶公司的初心是否依旧,是以大模型为主的智能化的大平台还是自动驾驶落地的产品?
最后从商业的角度来看,自动驾驶技术的最大应用场景是面对C端的乘用车市场,而大模型无论是作为产品还是公司面对C端市场比较困难,这一点是国内和国外最大的不同之处,国外的ChatGPT从研发期进入使用期,用户数据开始积累生态占据先发优势,即使再造一个GPT也很难超越,从其发展的过程中可以看出商业模式主要是API、订阅服务和面向B端打包进其他公司产品中收费,而在中国互联网企业林立,大模型众多,相比于C端需要时间和数据的积累,所以B端是一条不错的道路,也就是说未来国内大模型公司主要客户将会是面对B端,国内最大的B端客户大家都懂的是谁。这就导致了大模型的商业模式和自动驾驶公司的商业模式在产品形态会出现分歧。
大模型的搭建需要数据和算力的支持。在语言生成和自动驾驶行业中,大模型的训练数据来源有很大差异。语言生成类大模型像ChatGPT主要使用互联网上的大量文本数据,而自动驾驶行业的数据来源相对有限,例如谷歌无人驾驶Waymo累计路测里程只有3000万公里。在数据量不足的情况下,过于追求大模型并不一定能够带来显著的优势,反而会对实际的C端用户体验产生负面影响,并且需要过度的资源投入。因此,在选择是否使用大模型时,需要谨慎考虑数据来源和成本问题。
ChatGPT的问世确实引发了业内的一股热潮。然而,如果大模型无法与具体的业务需求相结合,反而会适得其反。在新产品开发过程中,技术创新的支持是必不可少的,但是仅有新技术并不能保证开发出优秀的产品,因为技术和产品都是为商业模式服务的。
虽然大模型在数据和算力达到一定规模时是一种科技方向,但它并不是通向通用智能的唯一路径。在数据和算力不断增加的情况下,自动驾驶行业更应关注如何处理系统的复杂性,满足丰富的产品需求,降低系统的复杂性才是新技术的重点目标。相比于不断增加复杂性,降低系统的复杂性能更好地优化自动驾驶系统。在自动驾驶领域,大模型需要大量的训练数据集,数据量不足或训练数据集不全将会影响模型的效果,同时,作为一个车规级产品,自动驾驶还需要满足数据安全和算法可解释性的设计要求。
将大模型算法移植到嵌入式平台进行知识蒸馏的过程也是不可控的,这个过程可能会在超算中心表现良好,但经过稀疏化处理、剪裁等过程后移植到嵌入式有限算力平台上,其效果可能会下降。因此,在实际应用中需要综合考虑技术可行性和商业可行性,并结合具体的业务需求和产品设计来选择合适的技术路径。
科研探索和产品开发是两种不同的活动。在科研探索阶段,资源和时间都是相对充裕的,科学家们可以通过不断地探索和试错来发现新的知识和技术,这些技术可以是很复杂和计算量大的,但是只要能够推进科学的进步,就值得去尝试。
然而,在产品开发阶段,情况则不同。产品开发需要考虑到商业的可行性、资源的限制和用户的需求等实际问题,需要在有限的时间和资源内找到最优解决方案。这个方案不一定是最先进或最复杂的,而是需要考虑到整个系统的性能、成本、稳定性、安全性等多个因素的综合考虑,从而得到最适合市场需求的产品。
因此,对于自动驾驶行业来说,大模型并不是必然的选择,需要根据具体的需求和限制来选择最适合的技术方案。在资源和时间有限的情况下,对于自动驾驶行业来说,需要将有限的资源用于解决实际问题和满足用户需求,而不是盲目地追求最先进和最复杂的技术。
欢迎全汽车产业链(包括动电池产业链)的天使轮、A轮企业入群(将面向包括顶流机构在家的800家汽车投资机构推荐);有科创公司领导沟通群、汽车产业整车、汽车半导体、关键零件、新能源汽车、智能网联汽车、后市场、汽车投资、自动驾驶、车联网等几十个群,加群请扫管理员微信(请注明您企业名称)