智东西
作者 智东西编辑部
一夜之间,微软的AI全宇宙已经成型。
今日凌晨,在一年一度的2024微软Build大会上,微软CEO 萨蒂亚·纳德拉(Satya Nadella) 一口气宣布了 50多项 AI能力更新,覆盖 GPT-4o上云、自研Cobalt芯片、团队版Copilot、SOTA小模型 等多个方面。
作为一场AI圈“开发者盛宴”,本次微软Build大会的发布主要有以下核心亮点:
1、宣布在Azure AI上普遍可用,并引入Cohere、Databricks、Meta、Mistral等公司以及开源社区 Hugging Face 的多个大模型,一边手握OpenAI,一边狠抓第三方模型及开源模型。
2、6月马上推出 Windows Copilot库 ,包含 40多种 型号的模型以及多种开箱即用的本地API。
3、推出 42亿参数 多模态SLM(小语言模型) Phi-3-vision ,支持图像理解与交互;同时提供70亿参数的Phi-3小型模型和140亿参数Phi-3中型模型,支持跨操作系统及云边端运行。
Phi-3-vision开源地址:https://huggingface.co/microsoft/Phi-3-vision-128k-instruct
4、推出最新端侧 小模型Phi-Silica ,专为Copilot+PC中的NPU设计,在SLM中取得。
5、宣布将通过Windows DirectML提供对 PyTorch、WebNN框架的原生支持 ,开发人员将拥有了一个Web原生的机器学习框架,使其能直接访问GPU和NPU。
6、引入 Copilot连接器(Copilot connectors) ,支持连接业务数据、工作流以及第三方SaaS应用程序,助企业构建和定制Copilot。
7、推出 团队版Copilot(Team Copilot) ,能扮演会议主持人、记录会议笔记、制作图表、管理工程等多种角色,并扩展出 Agent(智能体) 能力。
8、 Azure AI Studio 平台将推出 自定义模型 功能,同时数据分析平台 Microsoft Fabric 增加了全新的 实时智能功能 。
9、向客户开放其 自研芯片 定制CPU Azure Cobalt预览版 ,性能最高提升。
10、宣布其将成 首批提供英伟达Blackwell GPU的平台 ,发布配备RTX GPU的Copilot+PC;与AMD扩展合作,Azure将成为 首个提供加速器ND MI300X V5通用版的云平台 。
纳德拉提到,过去一年最突出的(趋势)是开发者如何利用大模型的能力去改变世界。
目前,微软已经建造了 三个平台 :首先是 Microsoft Copilot ,成为用户的日常助理,帮助用户采取行动;第二个是 Copilot堆栈 ,帮助开发者更快构建AI应用、解决方案;第三个是 Copilot+PC ,第一台AI PC。(微软向苹果开火!AI PC全家桶装上GPT-4o,AI实时聊天教你打游戏,高通赢麻了)
值得一提的是,在大会进行了超过2小时的最后时刻,OpenAI CEO 萨姆·阿尔特曼(Sam Altman) 现身,他透露新模式和整体智能将是 OpenAI下一个模型的关键 ,同时速度和成本也很重要。
一、自研Cobalt芯片公开预览, 将发RTX GPU版Copilot+PC
纳德拉称,微软今天将发布 余项 更新,按照Copilot堆栈的结构顺序来解读。
在AI基础设施方面,纳德拉谈道,为贯彻可持续发展,到2025年,微软所使用的能源将100%来自零碳能源。
去年11月,微软发布了首个云上AI超级计算机。现在,Azure的超算能力提升至30倍。
在与英伟达的合作上,双方覆盖了从云、AI平台到App应用的全栈流程。
微软将成为首批提供 英伟达Blackwell GPU 的平台,在未来几个月将发布配备RTX GPU的Copilot+PC,为游戏玩家、创作者和开发人员提供更高的性能,以应对本地AI工作负载,同时提供微软全新的Copilot+功能。
微软宣布与AMD扩展合作,Azure将成为首个提供 加速器ND MI300X V5 通用版的云平台,它将提供最佳的GPT-4性价比。
微软也持续更新,其首个集群已上线,正在为Copilot、Azure OpenAI等服务提供算力支持。
微软基于Arm的CPU Azure Cobalt 进入公开预览阶段,性能最高提升40%。纳德拉称,Cobalt被用于Microsoft 365中的视频处理和权限管理,已经支持了Microsoft Teams等服务中的数十亿次对话,目前已服务了西门子、Snowflake等企业。
二、GPT-4o接入Azure,多模态小模型Phi-3-vision亮相
目前已经有超过 5万 个组织使用Azure AI。纳德拉称,这一切都始于其与OpenAI的战略合作。
微软宣布 GPT-4o即日起在Azure AI上普遍可用 。这意味着现在任何应用程序、网站都可以变成一个多模态、全双工的会话界面。
比如用户可以在网页中获取Agent的主动询问服务,当得知用户在为露营做准备时会为他提供建议,帮他挑选需要加入购物车的物品。
就在上周,OpenAI推出最新多模态模型的GPT-4o,昨天微软展示了Copilot如何在视频中利用GPT-4o,支持用户分享屏幕或会话以获取Copilot的帮助,无论是辅助游戏、编辑文档还是编程都能胜任。
比如用户在一个游戏中设法制作一把剑,Copilot可以识别用户的屏幕,与用户对话并帮他完成这项游戏任务,比如提醒他“需要一些材料”、“按键盘上的E打开装备库”、“去收集木头、石头等资源”等。
接下来,微软还带来了
很多其他模型
,包括Cohere、Databricks、Meta、Mistral、 Snowflake等公司的模型都可以在Azure AI获取。微软宣布接下来将从Core42、NTT>
既要OpenAI,又要Open的AI ,微软宣布 加强与开源社区Hugging Face合作 ,将从其引入更多的模型接入Azure AI Studio。
微软不仅在发展大语言模型,还希望领导小语言模型革命。
微软现在正在扩充Phi-3系列小模型的版本, 宣布推出具有语言和视觉功能的42亿参数多模态模型Phi-3-vision 。它可以对图像进行推理,产生见解并回答图像相关的问题。
微软还将提供 一个70亿参数的Phi-3小型模型 和 一个140亿参数Phi-3中型模型 。通过Phi-3,用户可以构建跨Web、Android、iOS、Windows和Edge的应用程序,也可以在本地硬件和云端之间快捷转换。
从基准测试来看,最强开源模型大有易主之势。中杯Phi-3-Medium以14B的参数,性能逼近混合专家模型Mixtral 8x22B和70B参数的Llama 3。
超小杯多模态模型Phi-3 Vision表现也相当出色,以仅4.2B的参数,性能比肩Gemini 1.0 Pro V和Claude-3 Haiku。
今天,微软还宣布推出 Phi-Silica 这一SOTA SLM,它由 专门为NPU和Copilot+PC设计 的Phi-3系列构建,提供快如闪电的设备推理和首个Token响应能力。 Windows是第一个拥有当下最先进的面向NPU定制的SLM平台。
三 、推出 Windows Copilot 库,原生支持PyTorch等框架
为了使Windows能够成为构建AI应用程序的最佳平台,微软将于6月推出 Windows Copilot 库 ,其中包含多种开箱即用的本地API,以及40多种型号模型,涵盖了从低代码工具到复杂管道,再到完全多模态模型的多个部分。
以Recall体验为例,它依赖于与Windows深度集成的设备模型来捕获屏幕上的上下文,将数据转换为向量嵌入并建立索引,从而支持用户直接回到应用程序过去的位置并进行操作。Edge和Microsoft 365应用程序都已经支持这一功能,很快Recall就会在微软365图表中提取上下文。
Windows Copilot库还提供 RAG(检索增强生成) 能力,用户可以用它来处理本地数据,在自己的应用程序中使用该能力。
微软宣布即日起,将通过Windows DirectML提供对PyTorch、WebNN框架的原生支持,这意味着Web开发人员终于拥有了一个Web原生的机器学习框架,使其能直接访问GPU和NPU。
四、发布Copilot Runtime,AI时光倒流,随时回溯PC页面
此外,微软宣布让 微软Teams成为开发人员与AI合作编程的最佳场所 ,在本周将发布完整的政策公告。
开发者将可以在微软Teams中使用并获取源代码,同时微软宣布推出 “现在见面(Meet Now)”功能,支持Teams团队成员之间在几秒钟内解决问题。此外用户将可以在Teams中使用自定义表情符号。
昨天微软宣布Copilot接入PC,但构建一个强大的AI平台需要的不仅是一个芯片或模型,而是从上到下重构整个系统。
新的Windows Copilot运行时是将Copilot堆栈扩展到Windows系统,Windows Copilot运行时是Windows 11的一个新组成部分。它包括 Windows Copilot库 、 AI框架和工具链 ,同时它建立在强大的 客户端芯片 基础上。
Windows Copilot运行时在操作系统方面,用户可以借助 Copilot Runtime 回溯他们在电脑收件箱中看到的任何东西;照片和绘画方面的应用程序让用户可以使用实时图像生成和一些滤镜效果将想法变为现实。
五、GitHub Copilot可扩展,开发者自定义
Copilot是生成式AI时代的第一款热门产品,目前GitHub Copilot已经有超过180万开发者,微软正在授权让开发者都能使用自己的母语访问编程语言和知识。
GitHub Copilot WorkSpace可以根据其对代码库的深刻理解创建规范,然后创建计划,用户就可以执行计划生成代码,这个过程中,从计划到代码,开发者都可以进行编辑,这是一种从根本上构建软件的新方法。微软将在未来几个月内广泛提供这一工具。
同时,微软通过Copilot连接了更广泛的开发人员工具和服务生态系统。
GitHub正在推出第一组由微软和第三方合作伙伴开发的 GitHub Copilot扩展 的私人预览版。这些新增功能允许开发人员和组织直接在GitHub Copilot Chat中使用Azure、Docker、Sentry等自定义GitHub Copilot体验。
GitHub工程副总裁Neha Batra展示了GitHub Copilot的能力。例如,开发者可以要求它用Java写一段质数测试,但是用西班牙语语音交互。
//oss.zhidx.com/uploads/2024/05/664ce4af035b9_664ce4aef17c7_664ce4aef1799_西班牙语交互.mp4
开发者可以@Azure并询问它可用的资源在哪里。
在网页端,开发者也可以让Copilot帮忙更新README文档。
六、引入Copilot连接器,连接内外部应用,定制开发智能体
开发人员现在可以在数据层、体验层 构建Copilot扩展以进一步自定义Copilot 。
纳德拉谈道,Copilot正在深入各行各业,例如68%的市场人员称Copilot帮助他们启动了创意流程、70%的知识工作者称Copilot帮助他们提升效率、在客服场景Copilot使得问题解决速度提升12%……
微软宣布将引入 连接器( Copilot connectors ,它能够使用业务数据、应用程序和工作流,帮助企业构建和定制Copilot。企业还可以通过该工具连接第三方SaaS应用程序,包括来自Adobe、Snowflake、ServiceNow等企业的服务。
微软将Copilot从个人助手扩展到团队助手,宣布推出 团队版 Team Copilot 。
它能在团队协作中扮演任何角色,例如扮演会议主持人、记录会议笔记、制作图表、管理工程等。该功能将在今年晚些时候上线。
不仅如此,Copilot还将扩展出 (智能体) 能力。用户可通过自然语言指令,或选择已有模板,让Copilot化身不同领域的专家。纳德拉说:“我认为这是明年将带来真正改变的关键一步。”
微软可以在所有的Copilot体验以及Microsoft Team中进行切换,开发者只需在SharePoint中单击,开发者的数据、应用、操作等就可以同步。
同时,Copilot扩展可以在任何地方任何设备上运行。Copilot的工作原理是对用户提示进行推理并将其映射到正确扩展,或者使用扩展程序进行更深入对话。扩展程序会提供快速操作的建议,向用户展示相关功能,使得Copilot能实时获取知识。
这些Copilot扩展也可以在团队会议、一对一聊天等各种场景使用。
此外,微软宣布将Windows Volumetric Apps引入Meta Quest头显,将Copilot引入3D虚拟空间。
七、端到端工具平台更新,Microsoft Fabric实时智能功能上线
Azure AI Studio提供端到端的工具解决方案 ,用于帮助开发者构建、训练、微调AI模型,同时提供了评估AI模型和应用的性能和质量,以及用以检测和组织提示词中是否注入攻击的工具。
模型会有很多具体的自定义用例,微软 Azure AI coustom models(自定义模型) 功能即将推出,使得开发者可以构建专属自己的相应领域和数据模型。
该平台有五大优势,包括所有人都可以构建自定义模型、输出将特定于域、多任务处理、基准定义的多模态最佳、特定语言能力。
在数据方面,微软为端到端数据分析平台 Microsoft Fabric增加了全新的实时智能功能 ,现已为开发者提供预览版。
在数据层面,为了训练微调模型,微软正在构建从操作、存储到分析的完整数据状态的平台。这其中的核心就是Microsoft Fabric,目前该平台已经有超11000名客户。
Microsoft Fabric中实现了计算、存储以及用户的体验与治理相互统一,并且允许开发者基于该平台在Azure之外的任何地方都可以进行数据处理。
实时智能功能可供无代码能力分析师和专业开发者使用。在该平台中,开发者可以获得有关数据流的实时可操作见解,并用于发现、管理和使用这些事件数据;并提供大量的受管控体验,开发者可以使用开箱即用的连接器从Microsoft和跨云引入数据,简单的拖拽操作就能将相关数据引入到Fabric的目录下。
开发者可以实时分析、探索数据并对其采取行动,微软还推出了新的Microsoft Fabric工作负载开发套件使独立软件供应商(ISV)和开发人员能够扩展Fabric内的应用程序,从而创建统一的用户体验,使这成为可能。
微软正在通过Fabric Workload Development Kit构建新的应用程序平台,集成了空间分析功能,开发者可以使用ESRI的工具和库分析自己的数据。
八、AI模型边际收益递减节点远未达到,要建造更大超级计算机
微软CTO凯文·斯科特(Kevin Scott)谈道,在过去一年中,微软基于Copilot堆栈做了大量工作,既优化了系统,使成本更低、功能更强大,还围绕核心AI平台构建了整个功能、系统、服务和云。
为什么能做到这一点?他称,这是因为微软部署了最多的生成式AI应用程序,拥有自己的Copilot堆栈,并以安全可靠的方式构建它们。
GPT-4o的一大惊人成就是实时响应用户的音视频交互需求,做到自然流畅。背后微软与OpenAI正在追求一个效率点,通过建造更大的超级计算机来打造下一代大模型。
从去年的GPT-4到今年的GPT-4o,对话价格已经便宜了12倍,而且模型的首个token响应速度也快了6倍。
背后,微软也正在从构建网络芯片到数据中心迭代做的全套优化,并基于这些硬件做大量软件开发工作,以真正释放硬件性能。
微软认为一个值得惊叹的事情是,这里没有边际效益递减的迹象。今天微软传达给大家的一个信息是, 随着时间的推移事物将以极快的速度变得更强大、更便宜 。
再来看看小模型。小模型运行所需的计算成本更低,但更适合在设备上运行,这通常意味着质量缩水。但微软在过去一年发现了一个高效前沿(Efficient Frontier),也就是小模型在场景中实现的质量变得相当高。
沃顿商学院教授Ethan Mollick对此评价道:由于微软正在训练模型,因此他比几乎任何人都更了解更多计算的影响,这值得注意。
九、阿尔特曼压轴现身,网友点踩质问斯嘉丽语音事件
在大会最后,OpenAI CEO萨姆·阿尔特曼(Sam Altman)作为特别嘉宾出现在现场。他并未明确预告下一代大模型,而是提到“模型会变得越来越智能,一般来说是全面智能”。
阿尔特曼透露新模式和整体智能将是OpenAI下一个模型的关键,同时速度和成本也很重要。
他同时提到,OpenAI的研发团队为保证GPT-4的安全都足了大量工作,但为了做到真正对齐,他们必须从研究和创建模型到安全系统,从制定政策到如何进行监控都设立不同的团队,这是巨大的工作量,但必须部署并让产品提供给用户使用。Altman对团队一起完成的工作感到非常自豪。
不过对于阿尔特曼的现身,网友们似乎“颇有微词”。在外媒记者提到他的X推文评论区,几乎全都是调侃或“阴阳怪气”OpenAI疑似未经允许使用寡姐音色的评论。(OpenAI又惹大麻烦!剽窃寡姐声音被控诉,不答应就抄)
有网友说:“谁去问问他关于Scarlett Johansson的事?”
还有的配上寡姐动图,说:“来吧,问出那个问题。”
也有网友讽刺道:“这是我们未经许可使用其声音的名人名单。”
结语:Copilot加速落地,微软AI全宇宙初现
正如今年微软Build大会的主题“How will AI shape your future?(AI将如何塑造你的未来?)”,本次微软通过基础设施、模型、软件工具链及应用等多方面50多项更新,让我们更加具体深切地感受到AI给各行各业带来的变化,加速渗透进人们的生活。
纳德拉说,70年前他有两个梦想:计算机能否真正理解我们?计算机能帮助我们将更多的数据进行有效推理、计划和行动吗?他认为现在这两个方面都已经取得真正的突破,Scaling Laws就像莫里斯定律推动信息革命一样,与模型架构一起推动这场智能革命。
如果说一年前微软通过推出Windows Copilot并将GPT-4嵌入Windows操作系统,标志其开建微软AI全宇宙;那么今天微软则通过Copilot的升级及接入各大产品的实践,使得这个AI全宇宙初步成型,并通过提速降价、生态合作等一系列手段,推动产业进入新的洗牌阶段。
李想甩锅人工智能?网友:信你个鬼
近日,理想汽车CEO李想发微博称:
对此,很多网友表示:
回看6月的前19天,理想CEO李想共计发布了34条微博。
其中有多条在线“爆粗口怼人”、“内涵”竞争对手,甚至偶尔还会在评论区和网友“对喷”。
难道理想CEO李想这次是想甩锅人工智能?
但不论事实如何,理想CEO李想发的该条微博都成功引起了大家的关注,宣传了自家的新技术——Mind GPT。
那理想CEO李想所说的Mind GPT到底是什么?
据了解,MindGPT是理想汽车自研的大模型产品,支持声纹识别、内容识别、方言识别、出行规划、AI 绘画、AI 计算等功能。
这有点像现在很火的ChatGPT,基于用户输入文本,自动生成回答的AI聊天机器人。
实际上不止理想汽车,今年以来不少车企都有所动作,有的是自己从零开始积累大语言模型的数据,有的是和成熟的大语言模型合作。
据不完全统计,仅仅在今年5月,就有长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企申请了GPT相关商标。
5月15日,蔚来汽车关联公司上海蔚来汽车有限公司申请了多个GPT商标,包括“KnowmeGPT”“NIOGPT”“NOMIGPT”商标,国际分类涉及运输工具、社会服务、建筑修理、科学仪器等。
5月26日,小鹏汽车关联公司广东小鹏汽车科技有限公司申请注册“XMARTGPT”“XPGPT”“XGPT”商标,国际分类涉及运输工具、通讯服务。
5月30日,长城汽车股份有限公司申请注册的商标为“长城汽车SPACEGPT、“GWMSPACEGPT”,国际分类为运输工具。
另外,吉利汽车、智己汽车、奇瑞新能源等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
6月15日,梅赛德斯-奔驰和微软宣布,两家公司正在合作测试车载ChatGPT人工智能。
不过不可忽视的是,大语言模型的搭建也并非易事,需要大量的技术积累和硬件投入。
而目前来看,像理想等车企所展示的GPT讲故事等功能,噱头的成分较多,建议大家现阶段买车时,不要将此作为重要参考因素。
毕竟使用过ChatGPT的人知道,ChatGPT有时候会胡说八道,时对时错。
更别说没有经过市场验证的车企GPT大模型,若是驾驶人遇到紧急情况,其任何一次错误的输出,可能都会引发无可挽回的后果。
当然,汽车智能化是大势所趋,AI和+硬件的结合无疑是汽车未来发展方向,我们期待各大车企造出真正的智能神车。
今日话题:你最看好哪家车企的GPT大模型?欢迎在评论区留言。
微软放大招计划100亿美元加码AIGC巨头行业风口开启?概念股已砸出深坑
在不少人看来,AIGC是下一个科技革命的开端,新的时代正在来临。
微软考虑向OpenAI投资百亿美元
微软目前就风靡全球的聊天机器人ChatGPT开发者OpenAI投资100亿美元开展谈判。这笔资金还包括其它风险投资机构。交易达成后,OpenAI的估值将达到290亿美元。报道称,目前还不清楚这笔交易是否已经敲定,但潜在投资者在最近收到的文件显示,原定是在2022年底前完成交易。
据悉,OpenAI公司成立于2015年,由特斯拉CEO埃隆·马斯克和投资家SamAltman等人创办,2018年马斯克退出公司董事会。去年12月1日,OpenAI正式推出新一代对话式语言模型ChatGPT,在人工智能生成内容(AIGC)领域引起了轰动,上线短短五天就吸引了超100万用户。
AIGC对内容生产的颠覆不仅体现在种类的多样性,更体现在效率的极大提升和成本的几何级缩减。
2022年12月,Science杂志发布了2022年度科学十大突破,AIGC正是其中之一。在不少人看来,AIGC是下一个科技革命的开端,新的时代正在来临。在2022年网络世界大会上,李彦宏指出,未来十年,AIGC将颠覆现有内容生产模式。可以实现十分之一的成本,百倍千倍的生产速度,生成AI原创内容。
A股上市公司透露AIGC布局情况
目前A股市场上布局AIGC领域的公司还比较少。具体来看,昆仑万维在AIGC领域已有相应的业务布局,旗下StarXMusicXLab音乐实验室已在国内外180多个音乐平台上线AI创作的歌曲,并在企业端与多个行业的头部公司达成合作。
中文在线一直在AIGC领域投入研究并已落地应用等,如公司已推出AI主播、AI绘画和AI文字辅助创作功能,并在研发推动更多AIGC功能落地。
天娱数科打造了虚拟数字人+虚拟空间+AIGC一体化应用平台“元享Meta-Surfing”,为用户在元宇宙中的数字身份塑造、元世界空间打造提供数据与算法服务。
科大国创自主研发的智能外呼机器人系统,采用纯软架构设计,基于AIGC技术,结合业务话术以及知识计算,进行语义理解与意图识别,智能自动生成交互内容。
中科金财基于Web3.0规则架构,研发了数字人内容制作引擎、元宇宙场景开发工具,并通过AIGC的企业级内容互动创作平台,实现与中科金财元宇宙数字化营销平台“觅际”融合。
吉宏股份在跨境电商板块和SaaS吉喵云的主要业务模块里使用的AIGC技术均是由自己开发。
焦点科技在商品文本描述自动生成领域利用了AIGC技术,其他方面应用尚在研发储备中。
概念股整体回撤大
8股业绩具备持续增长潜力
数据宝统计,截至1月11日收盘,AIGC概念股合计A股市值3911亿元。今年以来,AIGC概念指数涨幅2.65%,小幅跑赢同期上证指数。二六三、盛视科技、拓尔思、中科金财、数字政通等股涨幅排前五位。
去年11月兴起的AIGC概念,目前热度明显降温。最新收盘价与2022年以来高点相比,概念股平均回撤幅度达到41.96%。恒信东方、首都在线、当虹科技、蓝色光标、山水比德等5股回撤幅度超过60%。
机构最青睐的AIGC概念股是哪只?数据宝统计,机构评级家数最多的是完美世界,共37家机构给予其积极型评级。其次是科大讯飞、浪潮信息等。按照5家以上机构一致预测,机构预测2022年-2024年净利润增速均超10%的股票有8只。最新估值水平来看,浪潮信息、捷成股份、完美世界等3股滚动市盈率低于30倍。
最新收盘价与一致预测目标价相比,捷成股份上涨空间70.19%排在首位。该股最新股价不足5元/股,较2022年以来高点回撤48.51%。1月以来捷成股份获北上资金增持1438万股,按照区间成交均价粗略计算,增持金额约0.66亿元。科大讯飞、浪潮信息上涨空间均超30%,1月以来两者获北上资金分别增持260万股、444万股。
车机的天花板?梅赛德斯奔驰布和微软宣布测试车载AI系统
各位老司机,平常你们喜欢用车载自带的车机,还是手机互联?现在中国各大汽车厂商除了内卷电动车续航之外,还内卷汽车智能化。现在有大家熟悉的包括华为、网络、科大讯飞和阿里等等大厂加持。
不过要说人工智能,谁才是顶流天花板?当然是从上年火到现在的ChatGPT了。这个隶属于微软旗下的OpenAI公司,从此也坐上火箭市值一直飙升。
不过之前ChatGPT的应用大多数还停留在网页人工智能对话,写写文案。但如果把他放到汽车里面,会有怎么样的效果呢?
这方面奔驰抢先去喝头啖汤了。近日梅赛德斯-奔驰和微软共同宣布,将ChatGPT功能添加到美国的奔驰汽车车机里面。 ChatGPT是微软的“生成式人工智能”软件,可以进行与真实人类对话类似的交互。
现在的梅赛德斯-奔驰汽车,车载系统是MBUX,MBUX系统首次于2018年在梅赛德斯-奔驰A级车上亮相,后来逐渐应用于公司旗下的其他车型。MBUX系统以其智能化、高度个性化和功能强大的特点而备受关注。已经具备语音命令功能,让驾驶员使用短语“嘿,Mercedes”,然后下达简短的命令来进行诸如调节车内温度、寻找导航目的地或拨打电话等操作。
微软表示,ChatGPT将使这些语音命令更加流畅自然,并可能启用其他功能。该系统不仅仅只回应简单的命令,还能进行更加自然的交流。该系统将能够记住正在讨论的内容,并与驾驶员或车内乘客进行反复对话。有了ChatGPT,该系统将能够回应更广泛的请求,包括与汽车或驾驶员无关的请求。例如,驾驶员可以问一个快速食谱,或者什么时候去旅行最好?
ChatGPT系统还可以与其他应用程序交互,处理诸如预定餐厅、购买电影票等事务。
在互联网上,ChatGPT已用于进行研究和撰写论文、选择股票,甚至为情感危机的人对话开导。
在过去的十年左右的时间里,包括梅赛德斯在内的汽车制造商已经为其汽车创建了越来越复杂的语音命令系统。它们被吹捧为比按钮或触摸屏更安全,因为驾驶员不必看开从而看得离目标越近。虽然一些研究表明,使用语音命令所需的心理处理仍然会分散注意力。
不过这些都不是重点,重点是OPENAi的创始人也曾经表示,AI其实也是非常可怕的。如果AI加入到汽车当中,全面接管汽车的其他功能,那个后果是无法想象的。
在此之前,苹果在全球开发者大会上发布了新一代CarPlay车机交互系统,用户将可个性化定制自己的仪表盘界面,如传统三圆仪表、双圆+中央信息显示屏等布局。路虎、保时捷、日产、福特、奥迪等多个汽车品牌进行深度合作,每一个品牌都有不同的设计。当然,车机的人工智能对话,就是基于苹果手机的Siri系统。