12月19日,AI初创公司Odyssey发布AI工具Explorer,该工具可将文本和图片转化为逼真的3D世界。Odyssey自定义设计的360度背包相机系统,可捕捉的真实世界风景进行训练,确保生成的3D场景既精细又逼真。生成的场景不仅具有高度的互动性,还支持导入UnrealEngine、Blender等主流创意工具进行后期编辑,极大地丰富了应用场景。
图灵奖得主、Meta首席AI科学家杨立昆指出,世界模型能够预测未来状态并据此做出合理规划与决策,类似于人类婴儿通过多看周边的事物认识世界。大模型在3D世界的探索,无疑使AI能够更准确地模拟和理解现实世界的复杂性。
ScalingLaw是大模型的规模定律,它认为随着模型参数的增加,模型的精度会在某一点上突飞猛进。传统的大模型主要依赖于预训练阶段的参数增长。今年以来,有关ScalingLaw是否已经发展到头成为业界讨论的焦点。
今年9月,OpenAI发布的新模型o1,为大模型的规模扩展提供了新的突破口。相对于预训练模型的“快思考”模式,推理模型o1引入“思考时间”概念,允许模型在给定的计算预算内进行更多的计算迭代。新模型的推理过程类似于人类的思考方式,包括打草稿、验证、纠错等步骤,这使得模型能够更深入地分析和解决问题。OpenAI称,o1模型是第一个具备真正通用推理能力的大模型。
OpenAI作为大模型领域的超级偶像,是当之无愧的业内风向标。近几个月,上海AI实验室发布了推理模型书生InternThinker,昆仑万维发布了Skyworko1系列模型,阿里发布了Marco-o1模型,由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学组成的研究团队推出了LLaVA-o1模型等。打着“微调”“复刻”“国产”旗号的类o1模型,强调的都是思考推理能力。在OpenAI提出的五级AGI(通用人工智能)概念中,具备推理能力的大模型终于进入L2阶段。
在应用层面,智能体无疑是2024年的香饽饽。美国银行的报告指出,AI进化正处于第三波浪潮的前夜———智能代理人工智能(AgenticAI)即将来临。
智能体是对人机交互范式的革新。百度创始人李彦宏强调,智能体是AI应用的最主流形态,“智能体可能会变成AI原生时代,内容、信息和服务的新载体”。智谱CEO张鹏表示:“Agent将极大地提升使用工具的能力,同时开启对自我学习能力的探索。”DeepMind资深研究科学家NenadTomasev指出,未来将从依赖单一的模型转变为构建拥有多种能力的智能体。
今年下半年以来,AIAgent备受热捧,一众科技巨头纷纷布局该赛道。微软在“Microsoftignite2024”大会上发布10多个商用AIAgent,苹果在开发者大会上发布了AppleIntelligence,OpenAI计划发布代号为“Operator”的AIAgent产品。在国内市场,最早探索Agent的大模型企业之一的智谱,推出了AI智能体产品Aut0GLM,它能够接收简单的文字或语音指令,自动完成一系列复杂的任务流程,用户不用动手就能完成点外卖、朋友圈点赞等手机日常操作。智谱12月推出的进阶版Aut0GLM,具备能听懂超长指令、支持跨App执行任务、支持长任务的自定义短语、随便模式提供抽盲盒式体验四大升级能力。
业内预计2025年有望成为AIAgent爆发元年。银河证券在其研报中预测,预计到2028年,中国AIAgent市场规模将激增至8520亿元,年复合增长率达72.7%。“未来的AI智能体可能比人类还多,人类将生活在一个有数亿、甚至数十亿AI智能体的世界中。”MetaCEO扎克伯格表示。