IT之家 10 月 21 日消息,谷歌首席执行官桑达尔・皮查伊上周四宣布,将负责公司 Gemini AI 助理应用程序的团队转移到其 DeepMind 研究实验室,继续整合公司在人工智能领域工作的各个团队。
皮查伊在博客文章中表示, 公司正在简化其结构,以“不断加快人工智能发展的步伐” 。他还宣布,谷歌搜索和广告部门的最高领导人普拉巴卡尔・拉格哈文(Prabhakar Raghavan)将在领导公司旗舰业务四年后离开该职位,转而担任谷歌首席技术官一职。
谷歌的资深高管尼克・福克斯(Nick Fox),曾担任拉格哈文手下的一名搜索副手,将接替拉格哈文领导公司的搜索、广告、地图和购物服务。
长期以来,谷歌在全球范围内占据搜索引擎的主导地位,但过去两年里,其在推出生成式 AI 工具和服务方面的表现被认为落后于微软、OpenAI 等初创公司。为了在新的竞争环境中保持竞争力,谷歌必须谨慎处理 AI 业务的扩展,以避免对其核心盈利模式造成影响。皮查伊在公告中将本次重组定位为加快公司在人工智能领域发展的措施。
IT之家注意到,在过去的六个月里, 谷歌一直在整合其专注于人工智能的团队,寻求改进 Gemini 模型以挑战 OpenAI 和 Anthropic 等公司 。今年 4 月,该公司将模型、研究和负责任的人工智能团队转移到 DeepMind 部门。不久之后,又将 DeepMind 与谷歌内部的另一研究部门 Google Brain 合并。
DeepMind 于 2010 年在伦敦成立,最初是一个学术研究实验室,于 2014 年被谷歌收购。近年来,DeepMind 逐渐从最初的研究驱动转向产品开发驱动。
DeepMind 的产品副总裁埃利・柯林斯(Eli Collins)在上个月接受彭博社采访时表示,无论是在谷歌内部还是外部,许多顶尖的研究实验室如今都已变成了产品公司。他说,DeepMind 不得不“加快步伐”以跟上人工智能创新的速度。
与此同时,谷歌还面临着来自联邦官员的越来越多的反垄断审查。今年 8 月,谷歌在一项诉讼中败诉,美国司法部指控该公司非法垄断在线搜索和广告市场。今年 9 月,针对谷歌在在线广告交易技术领域主导地位的另一场审判结束,预计今年年底将有判决结果。
gemini上线时间
2023年12月6日。 根据谷歌DeepMindCEODemisHassabis的宣布,Gemini1.0于2023年12月6日正式上线。 Gemini是谷歌最大的人工智能模型,采用了64个稀疏的Transformer块,拥有超过1.6万亿的参数,通过训练约5000亿个单词,并且使用了超过1.4万张GPU。
Gemma官方介绍(全文翻译)
Google致力于让人工智能惠及所有人。 我们有悠久的历史向开源社区贡献创新,如Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode等。 今天,我们很高兴推出Gemma,这是一个新型开放模型,旨在帮助开发者和研究人员负责任地构建人工智能。 Gemma是一系列轻量级、最先进的开放模型,采用了与创建Gemini模型相同的研究和技术。 由Google DeepMind和Google的其他团队开发,Gemma受到Gemini的启发,其名称反映了拉丁文中的gemma,意为“宝石”。 除了发布模型权重之外,我们还提供工具,支持开发者创新、促进协作,并引导对Gemma模型的负责任使用。 从今天开始,Gemma在全球范围内提供。 以下是关键的详细信息:我们发布了两种规模的模型权重:Gemma 2B和Gemma 7B。 每个规模都有经过预训练和指导微调的变体。 新的负责任生成式人工智能工具包提供了使用Gemma创建更安全人工智能应用程序的指导和必要工具。 我们提供了适用于所有主要框架(JAX、PyTorch和TensorFlow通过本机Keras 3.0)的推理和监督微调(SFT)的工具链。 与Ready-to-use Colab和Kaggle笔记本以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成相结合,使得使用Gemma变得非常容易入门。 经过预训练和指导微调的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,并可以轻松部署在Vertex AI和Google Kubernetes Engine(GKE)上。 跨多个人工智能硬件平台的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。 使用条款允许各种规模的组织进行负责任的商业使用和分发。 Gemma模型与Gemini共享技术和基础设施组件,Gemini是我们目前广泛可用的最大、最强大的人工智能模型。 这使得Gemma 2B和7B在与其他开放模型相比的规模下能够实现最佳性能。 而且,Gemma模型可以直接在开发者的笔记本电脑或台式电脑上运行。 值得注意的是,Gemma在关键基准测试中超过了规模明显更大的模型,同时遵循我们对安全和负责任输出的严格标准。 Gemma是根据我们的人工智能原则设计的。 为了确保Gemma的预训练模型安全可靠,我们使用自动化技术从训练集中过滤掉特定的个人信息和其他敏感数据。 此外,我们采用了广泛的微调和来自人类反馈的强化学习(RLHF),以使我们的指导微调模型与负责任的行为保持一致。 为了了解和减少Gemma模型的风险概况,我们进行了强大的评估,包括手动红队测试、自动对抗测试以及对模型进行危险活动评估。 我们还发布了一个新的负责任生成式人工智能工具包,与Gemma一起帮助开发者和研究人员优先考虑构建安全和负责任的人工智能应用程序。 该工具包包括安全分类、调试和指导。 Gemma支持多种工具和系统。 您可以在自己的数据上对Gemma模型进行微调,以适应特定的应用需求,如摘要生成或检索增强生成(RAG)。 Gemma在多框架工具方面提供跨多框架Keras 3.0、本机PyTorch、JAX和Hugging Face Transformers的推理和微调的参考实现。 Gemma在跨设备兼容性和尖端硬件平台方面表现出色,与NVIDIA GPU合作优化了Gemma,从数据中心到云端再到本地的RTX AI个人电脑,确保行业领先的性能并与尖端技术集成。 优化用于Google Cloud,Vertex AI提供广泛的MLOps工具集,具有各种调优选项,并使用内置推理优化进行一键部署。 高级定制可以通过完全托管的Vertex AI工具或自管理的GKE进行,包括在GPU、TPU和CPU之间以成本效益的方式在两个平台上进行部署。 Gemma为支持人工智能创新的开发者和研究人员开放的社区构建。 您可以通过在Kaggle中获得免费访问、在Colab笔记本的免费层级以及首次使用Google Cloud的用户可获得的300美元信用额度,从今天开始使用Gemma。 研究人员还可以申请高达50万美元的Google Cloud信用额度,以加速他们的项目。 您可以在/gemma上了解有关Gemma的更多信息并访问快速入门指南。 随着我们不断扩展Gemma模型家族,我们期待为各种应用引入新的变体。 请关注未来几周的活动和机会,与Gemma一起连接、学习和构建。 我们迫不及待地想看到您创造出什么来!
谷歌Gemini时代来了!加固搜索护城河、赋能全家桶,Gemini 1.5 Pro升级至200万token
谷歌于3月中旬宣布,Google I/O 大会定于北京时间5月15日凌晨1点召开。 然而,在大会开始前夕,OpenAI发布了颠覆性作品GPT-4o,将AI争霸带入新阶段。 谷歌官方账号发布了一段与Gemini语音交互的视频,展示Gemini不仅能够实时识别场景,还能进行流畅的语音交互。 尽管存在质疑其造假的声音,但谷歌在主题演讲中并未带来语音交互功能的实测。 谷歌CEO Sundar Pichai介绍了Gemini 1.5 Pro的更新,上下文窗口扩展到200万tokens,并提供私人预览版,同时向全球开发人员提供改进版Gemini 1.5 Pro,可用于35种语言。 Gemini 1.5 Pro经过算法改进,在代码生成、逻辑推理、多轮对话和音频图像理解方面有很大提升。 在Google Workspace中的更新包括Gmail、Docs、Drive、Slides和Sheets中升级至Gemini 1.5 Pro,Gmail移动端APP推出了新功能如总结邮件、上下文智能回复、Gmail Q&A,以及支持多语音写作。 此外,谷歌推出轻量级模型Gemini 1.5 Flash,针对大容量高频率任务进行优化,成本效益更高,具有突破性的长上下文窗口。 Gemini 1.5 Flash同样具备多模态功能,可以分析音频、视频和图像。 谷歌还宣布推出新一代开放式人工智能创新模型Gemma 2,并在6月正式发布新尺寸。 谷歌推出实时多模态AI Agent Project Astra,通过连续编码视频帧,将视频和语音输入结合到事件时间轴中,提高信息处理速度。 Veo和Imagen 3分别是最新的视频生成模型和高质量文本到图像模型,能够生成高分辨率视频和高质量图像,同时理解自然语言和提示意图。 谷歌搜索迎来了大模型时代,Gemini的加入进一步解锁了搜索中的新Agent能力,拓展了更多的可能性。 AI Overviews功能推出,用户提问后无需自己拼凑信息,谷歌搜索将列出信息概览,包括多种观点和链接进行更深入的探索。 多步骤推理技术将用户的总问题分解并确定解决顺序,使用最优质信息进行问题推理。 Trillium TPU是谷歌性能最好、效率最高的TPU,每个芯片的计算性能提高了4.7倍。 Axion处理器是谷歌首款基于Arm的定制CPU,具有业界领先的性能和能效。 谷歌与英伟达合作,将在2025年推出Blackwell芯片。 DeepMind创始人Demis Hassabis强调了AlphaFold 3的重大突破,在精准确定药物靶点等研发项目中至关重要。 谷歌AI for Science布局的最新进展包括AlphaFold 3的开源计划,对生命健康领域发展具有深远意义。