ChatGPT有新模型了!
官方账号宣布: 最新版本GPT-4o从上周起已实装 ,我们猜你会喜欢的。
然后……就尴尬了 ,下面评论区画风是一片的:“啊?改哪里了?没发现啊”。
以及 “OpenAI没活了” ,推测新模型硬指标超不过隔壁Claude-3.5-Sonnet,正式发布不太合适,只能采用拐弯抹角的方式。
新版ChatGPT更像Claude了?
根据ChatGPT官方账号对网友的回复,在ChatGPT上的这款新模型 与之前API更新的gpt-4o-2024-08-06还不是一回事 。
好消息是 免费用户也可以体验到 (有消息数量限制)。
最近比较流行的几项大模型智商检测里, “Strawberry里有几个r” ,ChatGPT新版模型和gpt-4o-2004-08-06都只能在特定问法下做对。
目前已知能较稳定做对的一个问法是“How many ‘r’s are there in the word Strawberry?”,中文版还没有发现。
同样的问法对于API版本来说,05-13版无法做对,不过08-06版也已经可以做对。
总结更多大家分享的试玩反馈,变化非常细微,主要体现在语气上人性化了一点。
研究AI写作的创业者认为, 新版ChatGPT给人的感觉稍微像隔壁Claude了一点 ,具体的变化是从8月8日上周四开始。
另外的改动可能在安全护栏上 。
AI越狱大师Pliny发现,他必须修改用了很久的越狱提示词才能破解新版模型。
emmm……换句话说,新版ChatGPT增加了防护但还是没防住。
另外有主要做AI生成正则表达式的创业者发现。
ChatGPT新模型回答风格和大模型竞技场上的“匿名聊天机器人” anonymous-chatbot 很像。
奥特曼带队,OpenAI员工集体炒作“草莓”
OpenAI内部围绕下一代模型“草莓”/Q*,正有一场外人看不懂的大型行为艺术。
CEO奥特曼本曼带头,发草莓照片当谜语人。
但这一次与之前不同,OpenAI不少员工也集体参与进来。
2019年加入的老员工Tao Xu把真草莓摆成Q形状,暗示草莓和Q*有关的。
再结合OpenAI总裁休长假,联创离职的消息,总之是有什么大事正在酝酿。
但是大伙实在是对行为艺术着实有点厌倦了。
当GPT遇到自动驾驶,毫末首发DriveGPT
月11日,在第八届毫末AIDAY上,毫末CEO顾维灏正式发布了基于GPT技术的DriveGPT,中文名雪湖·海若。 DriveGPT能做到什么?又是如何构建的?顾维灏在AIDAY上都做了详细解读。 毫末判断,DriveGPT雪湖·海若还将在城市NOH、智能陪练、驾驶捷径推荐、脱困场景中得到应用,最终目标是要实现端到端自动驾驶毫末在AIDAY上宣布,DriveGPT雪湖·海若将在即将量产上市的新摩卡DHT-PHEV首发。 超级充电站刚讨论过GPT上车没几天,就有厂商带来新进展。 4月11日的第八届HAOMOAIDAY上,毫末智行发布DriveGPT雪湖·海若,这是用于自动驾驶的生成式大模型,其参数规模已经达到1200亿。 和ChatGPT在AIGC(AI-GeneratedContent,人工智能生成内容)领域一样具备颠覆性的事情正在发生。 在本周的在第八届毫末AIDAY上,毫末智行发布了首个应用GPT模型和技术逻辑的自动驾驶算法模型DriveGPT,并正式官宣中文名为“雪湖·海若”。
AI大模型扎堆上线,你觉得谁能强势出圈?
撰文 / 涂彦平编辑 / 黄大路设计 / 赵昊然ChatGPT在这个春天霸占了中文互联网,普通人面对它多生出兴奋和焦虑交织的复杂情绪,而大公司不甘落后,纷纷宣布自己也在做类似的AI大模型。
继3月16日网络发布文心一言之后,4月7日,阿里云官宣大模型通义千问开始邀请测试。
4月8日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇分享了盘古大模型的进展及应用。 他透露,华为盘古大模型正在推动人工智能开发从“作坊式”到“工业化”升级。
接下来,有多场大模型相关发布会扎堆举办。
4月10日,商汤“日日新SenseNova”大模型体系问世;4月11日,毫末智行自动驾驶生成式大模型DriveGPT雪湖·海若发布;由昆仑万维和奇点智源合作研发的天工大模型3.5发布在即,并将于4月17日启动邀请测试;5月6日,科大讯飞“1+N认知智能大模型”即将发布……
互联网巨头、人工智能公司、智能硬件公司、自动驾驶公司等各方力量,都积极参与到大模型这一场盛宴中来。
行业监管也迅速出手。 4月11日,国家网信办发布通知,就《生成式人工智能服务管理办法(征求意见稿)》面向社会公开征求意见。
根据计算机科学家、自然语言模型专家吴军的说法,ChatGPT背后是一个叫做语言模型的数学模型在发挥作用,这项语言模型技术早在1972年就已经有了,是由他的导师弗莱德里克·贾里尼克(Fred Jelinek)在IBM期间带领团队研发出来的。
只是到了今天,由于算力不断提升,语言模型已经从最初基于概率预测的模型发展到基于Transformer架构的预训练语言模型,并逐步走向大模型的时代。
复旦大学计算机学院教授、MOSS系统负责人邱锡鹏曾这样描述大模型的能力飞跃:“当模型规模较小时,模型的性能和参数大致符合比例定律,即模型的性能提升和参数增长基本呈线性关系。 然而,当 GPT-3/ChatGPT 这种千亿级别的大规模模型被提出后,人们发现其可以打破比例定律,实现模型能力质的飞跃。 这些能力也被称为大模型的‘涌现能力’(如理解人类指令等)。 ”
每当有革命性的技术诞生,无一不是由其在具体行业的商用化应用来实质性地推动行业进步。 作为连接技术生态和商业生态的桥梁,大模型也将在很多行业应用落地。
只是,这波来势凶猛的大模型热,究竟会催生万物生长改变万千业态,还是继区块链、元宇宙之后又一个看上去很美的泡沫?
无限想象空间?特斯拉将Transformer大模型引入自动驾驶领域中,拉开了AI大模型在自动驾驶领域应用的开端。 大模型在自动驾驶行业的应用将提升系统的感知和决策能力,已经被视为自动驾驶能力提升的核心驱动力。
4月2日,网络正式发布网络自动驾驶云Apollo Cloud2.0。 网络智能驾驶事业群副总裁、智能网联业务总经理高果荣表示,Apollo Cloud2.0基于大模型实现了自动驾驶数据智能的搜索引擎,大模型的能力积累了自动驾驶数据智能的搜索引擎,从海量数据中能够精准找到自动驾驶面向不同场景的数据。
“在自动驾驶领域,BEV(Birds Eye View,鸟瞰视图)是当前主流的技术路线,未来可以朝着多模态、通用智能的方向发展。 ”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示。
他认为,在通用人工智能时代,输入提示词和多模态内容,就可以生成多模态的数据,更重要的是,可以用自然语言生成对任务的描述,用非常灵活的方式覆盖大量的长尾问题和开放性的任务,甚至是一些主观描述。
王晓刚举了一个例子来说明AI和AGI处理任务的不同。给定一张图片,判断是否需要减速,AI和AGI的反应有什么不一样呢?
现有的AI系统,会首先做物体检测,然后再物体框里做文字识别,最后做决策。 整个过程中每一个模块都是事先定义好的任务。
而在通用人工智能下,给定图像,人们只需要用自然语言去问问题,比如,“这个图标是什么意思?我们应该做什么?”模型本身不会发生变化,它会通过自然语言的方式给出一系列逻辑推理,最后得出结论。 比如,它会说,“前面限速30公里/小时”“前面100米是学校区域”“有小孩”“应该小心驾驶”“将车速降到30公里/小时以下”等。
王晓刚还指出,智能驾驶汽车领域有“数据飞轮”的说法,通用人工智能时代则会产生“智慧飞轮”,人和模型之间可以互动,通过人的反馈,模型能更好地理解人需要它展示什么样的能力,而去解锁更多技能。 从数据飞轮升级到智慧飞轮,可以实现人机共智。
商汤基于多模态大模型,可做到数据的感知闭环和决策闭环。 从前端自动采集高质量的数据,到利用大模型进行自动化的数据标注和产品检测,“能够几百倍地提升模型迭代的效率并降低成本”。
华为云EI服务产品部总裁尤鹏也表示,“整个数据标注是整个自动驾驶领域准确率、效率、成本最高的一部分”,这部分的效率直接影响到自动驾驶算法和驾驶等级的提升。 他透露,华为云正在做预训练标注大模型,支撑后续的自动驾驶算法的训练,可能会在几个月后会发布。
除了自动驾驶,很多行业人士相信,智能座舱也将在大模型的赋能下有着质的提升,尤其将为人机交互打开新的大门。
网络集团资深副总裁、智能驾驶事业群组总裁李震宇认为人工智能将重塑汽车空间,人与汽车的关系将会截然不同。 “未来,我们相信每辆汽车都会搭载一个数字虚拟人。 未来的数字虚拟人不仅可以模拟人的外形,还可以注入灵魂,真正拥有对人类意图的理解……同时也不再是单一以前场景的车机助理的身份,而会转化成全能助理。 ”
他相信,随着通用人工智能的发展,智能座舱将成为汽车创新的新焦点,将会重塑其空间,届时用户和车企之间的距离将缩短,用户和品牌之间的关系将更为紧密。 “拥有自然语言交流能力的智能车可以让车企与用户直接进行一对一的对话。 当汽车成为全能助理后,车企将面对用户需求爆发式的增长。 ”
王晓刚称,在智能座舱板块,通用人工智能可以使基模型具备对空间环境的理解、用户状态的感知、多模态指令解析及多轮逻辑对话、内容生成等一系列能力,进而赋能包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,不断地提升个性化体验,进一步拓展应用场景。
“智能汽车是通用人工智能实现闭环的一个非常好的场景,我们已经有人机共驾。 ”王晓刚表示,“未来我们希望车和模型之间能够产生更有效的互动,那就完成了从人到车到模型这样一个互动闭环,能够让通用人工智能为我们提供更好的驾乘体验,解锁无限的想象空间。 ”
只是,消费者距离这种有着“无限的想象空间”的汽车生活还有多远,没有人说得出答案。
希望在于将来想象是美好的,不过,挑战也随之而来。
“过去我们一年要做大概1000万帧的自动驾驶图像的人工标定,请外包公司进行标定,大概6到8元钱一张,一年的成本接近一个亿。 但是当我们使用软件2.0的大模型通过训练的方式进行自动化标定,效果会非常可怕——过去需要用一年做的事情基本上三个小时就能完成,效率是人的1000倍。 ”理想汽车创始人、董事长兼CEO李想OK表示,“对于员工来说,他们会感觉用拳头打架遇到了拿枪的。 ”
他认为,在这样的状况下,如何能够让软件2.0和现有人才进行融合,为他们提供怎样的全新工作流程、激励机制,如何去选用任用人才,给全行业提出了挑战。
更大的挑战可能还在于中外大模型技术的差距。
3月25日,在2023中国发展高层论坛上,360创始人、董事长兼CEO周鸿祎表示,目前来看,中国大语言模型和GPT-4的差距在两到三年时间,GPT的技术方向已经明确,不存在难以逾越的技术障碍,中国在场景化、工程化、产品化、商业化方面拥有巨大优势,应当坚持长期主义精神,迎头赶上。
4月9日,由中国人工智能学会主办的人工智能大模型技术高峰论坛上,融汇金信CTO李长亮认为,未来做通用大模型的和做场景的分层很清晰,没有中间态。 做通用大模型需要大量的算力、数据、人员、资源等,只有有很强技术储备和资源调配能力的大公司才能做,中小创业公司在这条赛道上会很难;在垂直应用上,基于大模型的发展,结合场景的know-how做一些创新应用,则会有无数的企业诞生。
他还认为,中国在大模型这个产业赛道上是很有机会的,因为在中文场景下,我们更懂我们自己的语言,沉淀了大量的中文知识,会迅速追赶并超越。
我们也注意到,计算机科学家、自然语言模型专家吴军在4月3日晚得到的一场直播中则给当下的ChatGPT热泼了盆冷水。 他直言ChatGPT在中国被过度炒作了,中国的大部分研究机构是做不了的。
在他看来,ChatGPT的原理很简单,但是在工程上要想做到,其实蛮困难,因为ChatGPT太耗资源,光硬件的成本就要差不多10亿美元,这还没算电钱。 ChatGPT训练一次要耗多少电?吴军的说法是,大概是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次。 这是非常花钱的一件事。
他的结论是,ChatGPT不算是一项新的技术革命,带不来什么新机会,最后可能的一个结果就是给几家大的做云计算的公司交钱。
由ChatGPT带起的大模型热,最终会在各行各业开花结果,还是盛名之下其实难副?不妨把这个问题交给时间。
意大利官宣禁止使用ChatGPT
意大利个人数据保护局于当地时间3月31日宣布禁止意大利人使用聊天机器人ChatGPT。 并且宣布对开发这一平台的open AI公司处理意大利用户信息的行为进行限制。 意大利的个人数据保济局还对此事进行了立案调查。 意大利个人数据保护局认为ChatGPT平台在3月20日出现了用户付款服务支付信息以及对话数据丢失的情况。 而平台收集和处理用户信息这一行为并没有进行告知和说明, ChatGPT平台存储个人信息,收集大量数据的行为,没有任何的法律依据。 要求open AI公司在20天之内,必须通过其在欧洲的代表向意大利个人数据保护局,通报其按照要求所采取的措施,否则将会对open AI公司最高2,000万欧元的罚款或者是公司全年全球营业额的4%的罚款。 由于科技的不断进步和发展,使得人类进入了一个全新的大数据人工智能的时代,新时代的到来,给人们带来很多机会的同时,也带来了很多挑战。 人们对于AI技术的认知和控制也会逐渐的发展和加深。 人类经过多年的探索和研究,发明,制作了很多新的科技手段来控制这个新的时代,但是也会随之而来,产生更多新的问题。 AI技术对于人类社会拥有着非常大的冲击,未来是否是可控制,以及进入大数据时代人类的个人信息是否能够得到更好的保护,都成为新的问题,在新的科技成果的运用上,一定要把握好。 AI技术在人类社会所产生的冲击已经逐渐的显现出来,正在逐渐的改变我们的生产方式。 创造了更高的生产率,同时也使得人类的生活质量有了很大的提升。 金融服务领域,医疗保健领域以及商贸行业等领域,AI技术都发挥了非常重要的作用,给人们带来了便利,但是同时也带来了很多问题以及隐患比如AI算法的数据及的偏见,透明度不高,安全问题和漏洞问题的,都会给人类造成一些负面的影响,这些都需要引起重视。