东南亚电商业务,是全球互联网巨头们都正在挤破头争抢的一块大饼,对于Lazada来说,一切都变得更难了。
聊到拓林思自研操作系统,曾经五年蝉联市场第一时,神情回味无穷,整个人也年轻了许多。当时的华为还是一片开源荒地。
英特尔凭借X86 在世界范围内处于核心地位,所有的Linux操作系统厂商在内的软件厂商都要向它寻求合作,包括国内的中科红旗、中标软件、拓林思、IBM等,以便能够配合英特尔硬件发布的路线图。那是2000年,拓林思内部刚经历了大震荡。到淘宝后,李勇牵头做了一个内核组,负责维护内部的Linux系统,这正是十年后对外开源的操作系统龙蜥的雏形。意味着欧拉支撑着华为集团的运营商BG,消费者BG,企业BG三大业务板块。也正是并入阿里云后,团队决定不做手机操作系统(阿里云OS),专心做服务器操作系统。
拓林思技术负责人陈棋德知道消息后,丧气地找到公司总经理周群说:我们没有路可走了,以后怎么办?果然很快,拓林思之前的PC服务器合作大厂戴尔、惠普、IBM等纷纷优先选择红帽,原因是这些服务器大厂都需要Oracle等数据库厂商认证。而在这场桌面竞争大溃败中,拓林思躲过一劫。从数据私有性的角度,可能还有各个公司/组织自己的LLM,当然也可以基于开源LLM来搭建。
从知识的专业性角度可能会有,比如HR行业模型,财务行业模型,法务行业模型等。但并不是所有的任务都适合使用 AI,因为有些任务用 AI 完成的效率并不一定高,比如查询中国的最低年假。面对诱惑大多数人都会放弃坚守,但我还是希望大家在设计产品时问自己一个问题,我的产品能不能带来10倍体验提升,能不能带来10倍成本的降低,普通人只能点滴的改变。因此,解决这些问题需要依靠对话式用户界面(CUI)的发展,我相信很快就会出现AI的类似于iPhone诞生后的Gesture时刻。
关于耳机的畅想我们可以后面进一步讨论。输出response,输出的内容产生了极大的不确定性,虽然可能是更好的输出,但是不可控性增强,原来返回的数据都是预设的,根据返回值要调用函数的,现在要用新的办法来解决,我预判未来在这部分会产生很多的中间件产品,可能以开源的为主。
(工作/业务流)第二步是利用AI的识别和推断进行任务和功能的调度。从平台的角度:LLM还解决不了线下交付的问题,理论上只要不是专有数据,LLM的用户体验可能会产生一些虹吸效应,让用户更多的访问LLM而不是传统的平台,平台当然可以自己做LLM,但是投入和效果上不一定比类似的百度的或者泛化LLM更有优势。现在的耳机已经可以透明收声,如果耳机具有一定的边缘LLM能力,《Her》的电影场景就可以实现了,基于语音的交互是最自然的对话。很多流程会从线性的变成星形的。
跟AI 1.0的状态差不多,可能有很多垂类模型,也有很多行业模型,当然也有可能出现AI四小龙或者N小龙的情况,因为很多数据,比如比银行数据,火车数据,民航数据,都不可能被放到公有LLM上,还是要在自己的私有LLM才可行。利用AI都予以理解和上下文能力,实现更流畅的用户体验,逐步替换掉传统的线性多级的工作流,实现一步到位的功能或者任务的调度。第三是多模态,输入input/输出output 变得极为丰富,但丰富也意味着极为不可控。因此用所谓动态的站在历史的角度出发的思考,AGI确实会取代一些初级的脑力劳动(机械的脑力劳动,甚至知识/事实的学习),但是用新的教育方式来产生创造性的思维,就可以指挥或者操作AI来提升效率,我们的教育体系也会从知识灌输变成思考方式和创造潜力的涌现,教育出来的这些四有新人再去创造更高维的AGI。
与手机相比,微信的新特性是扩大了通讯录,使通讯录中的联系人数量增加了百倍,更能够进行面对面的沟通。耳机不再只有降噪这个卖点,而是交互的终端,是conversation的承载,是任务指令的下达。
不夸张的说,这可能是,或者至少是科技行业的人类的群星闪耀时,而且后续也将影响更多行业和从业者。每个模型都抽象了很多的业务逻辑,而这些业务逻辑是依靠LLM来完成功能的实现的,针对这些业务逻辑都需要对模型进行单独的训练,而不是简单的用一个超大泛化模型可以实现的(除非超大模型用各行各业的数据进行训练和修改,这样其实对于基础模型可能是非常不经济的,不过也可能跟软件行业一样,很多软件公司的增长也是通过收购和整合来实现的)。
写在最后:以上都是我几个月以来的思考在当下这个时间点的总结,未来会发生什么,也很可能会推翻现有的结论甚至思考框架,未来一定是薛定谔的猫,LLM这个变量将让很多人的思考框架发生了巨大的变化。经过这4个多月的时间,很多原来的工作习惯被迭代,很多原来的认知被重置,很多原来的范式被改变。机器取代了一些初级的劳动者,而大家踊跃通过教育变成高级的劳动者去操作和管理机器,这样就形成了一个正向的循环。但是如果大家看过那段资本主义萌芽的历史就知道,当时的人们其实也找不到这个现在大家公认的路径,大量的工人失业,社会甚至还造成了某种程度的动荡。因此这个是产品设计范式的转变。但是反过来想一下日常的对话都是自己发起的么?显然不是,实际生活中不同的场景,很多都是用户是被动应答的。
AI-Native的软件也是一样,都要有这个过程,这个过程不会很久,正在发生。浪潮中,有些人追求宏大的叙事,有些人忙于性感的故事,有些人挥起锋利的镰刀。
(复杂业务逻辑)第三步是利用AI来整合业务逻辑(甚至整个SaaS的业务逻辑就是依靠AI,而不需要重新定义和开发),而不仅是进行功能和数据的调度。这个普世的转变,对产品经理来说更是一个设计产品范式的根本性转变,而这个转变带来的软件设计模式(Design pattern)都会发生根本性的变化(后面我们会单独讨论)结论:经过在自己研发的产品上几个月的试错和调整,我们也形成了行业软件/SaaS对LLM能力的应用的Best practice。
原因是如果出现超级LLM,那LLM本身就有是平台,对现有平台产品来说可能会损失品牌,躲到LLM后面,沦为工具,但不管怎么样,平台还是应该拥抱LLM,利用好LLM的能力,也可能走出一条不一样的路。首先是语言 language,自然语言的交互方式,很底层的人类交互手段。
基本上做到了第三步才是真正的用AI/LLM来定义和实现完整的软件功能和逻辑,而不仅是交互方面的调度,我觉得可能在相当长的一段时间内都是用第二步和第三步之间的方式来实现软件/SaaS的AI/LLM化,而不是Native AI/LLM软件/SaaS。基于以上的场景和分析从模型的角度:除了大家现在比较关心的基础通用型LLM外,未来可能会有很多的行业/场景型LLM。中间是CUI,主要的交互和任务都在这里完成。只要你的value只是线上薄薄的一层,哪怕再高的知识密度,你的可替代性也不会很低。
这样系统的输入方式和形式以及效率都会得到大幅度的提升。不过有一些传统业务功能的局限却可以用自然语言的形式来实现,比如输入基础考勤和税务信息根据每个国家工资的算法进行月度工资的计算是非常复杂的逻辑和算法,用自然语言是不容易实现的,但是基于这个算薪结果进行比较又是用传统的逻辑和算法无法完成的,而一般都需要人为的查询和比较,并解释。
在这个Sternstunden der Menschheit,我们可能有的只是时间。甚至也会由于数据合规性的考虑会出现个人LLM和边缘LLM。
LLM会逐步的部分或者全部替代掉SaaS的业务逻辑,但是传统的业务逻辑是不是更高效这点需要针对不同的业务逻辑单独的比较和验证。那么,现在新一代的AI又带来了哪些新属性呢?我想到了一些,也欢迎大家补充。
基于以上内容,我来抛个砖,4个月前开始考虑LLM对于我们的影响以及如何拥抱并形成或扩大自身产品的差异和壁垒。中间的对话框不止是一个传统软件的rich text area,这里包含的很多的元素,其实类似的微信对话框里不同的format,比如一个网页,一个文件,一个小程序,其实企业微信和叮叮也都有类似的设计,只不过通讯/协同软件更多的还是人和人对话,现在的对话框不再是或者不仅限于人和人了,更多的是人和LLM,对话框里要可以显示和处理更多的格式,比如微信不支持markdown(因为正常人不会用这种格式跟别人交互),现在需要支持更多的文本格式,因为用户不仅是要在对话框里完成对话,更重要的是要在对话框里完成任务,完成指令,而不只是把对话框当作信息的传递,具体的任务要跳出对话。其实很多应用会产生大量的专有数据,比如购物网站产生的用户购买行为和偏好,比如社交应用产生的用户行为和交互的偏好,这些其实都有很大的价值,LLM其实是反向逼迫大家来审视自己的数据资产,以及如何更好的利用它。主动与被动:其实大家日常使用的AGI应用无论2B还是2C,几乎所有的场景下的应用都是被动呼出的,也就是说都用户提出问题,LLM被动回答。
但是看了YC去年的List后觉得AI-Native应用的前景已经非常明朗了,AI已经深入寻常百姓家。因此2C/2B级别的应用,如果你的交付是纯信息的形式,开放形式的,范知识类的,那么长期看大概率都是有风险的。
个人觉得替代工作流更像一个trade off是兼容之前的古典软件设计范式,而不是新的范式,新的范式是下面的第三步,完全的业务逻辑AI化。不过这个完全是个人脑爆,毕竟旅游行业的供应链管理是相当复杂和高壁垒的,我们有相当长的时间可以观察,思考和应对。
因此,在选择使用 AI 还是传统方法完成任务时,我们需要具体考虑任务类型和预期结果,避免浪费。1产品/软件设计的范式转变基于以上的特性,SaaS/软件行业对AI的垂直integration,我预想大概是可以分成三步,每一步都比上一步更深入,对AI模型能力的使用也更充分。