IT之家 11 月 3 日消息,中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。
时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言, 将方言种类从 30 种提升至 40 种,并引入对英文的识别 。
与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“ 预训练 + 微调 ”的模型方案与方言场景的需求能够高度契合。
TeleAI 还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅降低约 50 倍,且保障模型效果与有监督训练的方言模型水平相当。
IT之家附 GitHub 开源地址:https://github.com/Tele-AI/TeleSpeech-ASR
麦芒30作为麦芒系列的首款AI手机,其AI功能丰富且实用,主要体现在以下几个方面:1. **星辰大模型赋能**:麦芒30搭载了由中国电信人工智能公司和中国电信研究院(TeleAI)完全自研的星辰大模型,该模型涵盖了“语音”、“语义”、“视觉”及“多模态”等领域,为用户提供了强大的AI能桥返唯力支持。 通过星辰大模型,麦芒30可以实现文案撰写、语音撰写、图像生成等多种功能,极大地提升了用户的日常使用体验。 2. **一键直达AI功能**:麦芒30设计了一个实体便捷X键,用户可以通过单击、双击、长按等多种交互方式快速激活AI功能。 例如,单击可以呼出常用APP的九宫格页面,敏培而双击和长按则可以支持自定义触达付款码、相机等特定功能或应用,极大地提高了操作效率。 3. **智能服务与应用**:麦芒30还基于AI技术开发了多项智能服务,如AI智慧相机、AI识屏和智慧小艺生活助手等。 AI智慧相机能够识别和处理各种信息,实现文档扫描、试卷还原等功能;AI识屏则支持AI选词、智慧抠图等功能,方便用户处理屏幕上的内容;智慧小艺则通过强大的自然语言理解能力,帮助用户完成各种任务,如设置提醒、查询天气等。 4. **深度学习与个性化建议**:未来,随着AI技术的不断发展,麦芒30有望通过深度学习和自然语言处理等先进技术,更好地理解用户需求,并提供定制化建议和服务,实现人世郑机共生的高度智能化。 综上所述,麦芒30的AI功能不仅丰富多样,而且实用性强,能够为用户带来更加智能、便捷的使用体验。