你只需要当导演 HuggingFace工程师打造 开源AI视频工具

机器之心报道

编辑:泽南、佳琪

Sora 一出,视频领域似乎已经进入了生成式 AI 时代。不过直到今天,我们仍然没有用上 OpenAI 的官方视频生成工具,等不及的人们已经开始寻找其他的方法。

最近几周,一款开源的视频编辑工具 Clapper 引发了人们的关注。

与很多科技公司提供的视频生成器不同,Clapper 是一款开源 AI 故事可视化工具,于一年前推出原型。它的设计目的并非取代传统视频编辑器,或使用 3D 场景作为输入的现代 AI 编辑器。

Clapper 的理念是集合各类生成式 AI 技术,让任何人都能通过交互式、迭代和直观的过程使用 AI 创建视频。无需外部工具、电影制作或 AI 工程技能。在 Clapper 中,你无需直接编辑视频和音频文件序列,而是通过调整高级、抽象的概念,如角色、位置、天气、时间段、风格等,基于 AI Agent 来迭代你的故事。

Clapper 的作者 Julian Bilcke 是 HuggingFace 的一名 AI 前端工程师。他表示,为了向这个方向继续努力,他还在开发导演模式:目标是让使用者可以全屏播放视频,舒适地坐在导演椅(或沙发)上,向 Agent 大喊命令,让 AI 制作电影。

最近几天,Julian Bilcke 已经上线了使用大模型将任意文本转换为时间线等新功能。而 Clapper 的热度也水涨船高,在 GitHub 上已经拥有超过 1100 的 Star 量。

如何使用

既然是开源工具,我们主要看的当然是具体好不好用。

还记得 AI 大牛 Karpathy 创作 AI 短视频的体验吗?为了将《傲慢与偏见》开头的三句话变成动画版,足足花了这位顶尖高手一个小时。虽然只有三句话,三个场景,但这个工作流远比三句话要复杂。他先用 Claude 根据原文生成了一系列图像提示词,再将这些提示词输入文生图模型生成对应的图像,再交给视频模型制作动画,配音的任务分配给了 Elevenlabs,最后在 Veed Studio 里把所有片段整合起来。

于是,Karpathy 做完后发推吐槽,称:「创业者们,机会来了!市面上急需一个能够整合、简化这些流程的 AI 工具。」

Clapper 正是一个集成了所有这些功能的一站式平台。

通常想做一条短视频,需要经历以下几个步骤。首先需要一个故事和脚本,然后根据脚本画出分镜,再根据分镜拍摄或寻找素材,将它们在剪辑软件拼合起来,添加动画效果和特效,再有选择性地配上口播、背景音乐或音效。因此,影视制作行业中编导、导演、摄像、剪辑、后期、配音等分工应运而生。

而在 Clapper,视频制作遵循另一条逻辑。它的每条轨道不像 Premier、剪映等剪辑软件一样对应着视频或图片素材,而是对应着一个具体的工种。

剪映的素材轨道

Clapper 的轨道

在用 AI 做视频这件事上,我们就是 AI 的甲方。Clapper 就像一个由业内最强的 AI 组成的剧组。Clapper 内置像 GPT-4o,Claude 3.5(Sonnet)等一系列「顶流」大模型。它就像乙方的执行导演一样,负责将你的需求对接给对应的「AI 编导」。

从上面的图中可以看出,第一条轨道代表着故事版,和 Clapper 内置的大模型对话,它将通过 API 调取文生图模型,让 AI 分镜老师来生成对应的图片,作为视频画面的基础。

通过 Clapper 可以访问以上文生图模型

以 Clapper 给出的样片为例,接下来的轨道依次对应场景、旁白、摄像机的视角、背景音乐以及音效。你可以要求 ElevenLabs 或 Fal.ai 为这个西部废土世界的故事生成一些废墟的风声或者枪战的爆炸声。

而 Clapper 还有一项功能,可能真的向「会说话就能拍电影」的愿望迈进了一大步。我们可以直接向 Clapper 导入剧本,并且在「故事」一栏细致地为你的主人公创造人设。

以《绿野仙踪》为例,我们不仅可以为人物添加更加个性化的人物描述,还可以上传图片,为女主人公多萝西设置视觉形象。这意味着我们可以请世界上的任何演员来扮演这个角色,哪怕你想看 18 岁的小李子演多萝西,都可以实现。Clapper 的功能细致到你可以调整人物的年龄和音色,每个场景的陈设,多萝西的房间有什么家具,他们冒险的目的地「翡翠城」的房子长什么样子,都可以在 Clapper 中随心调整。

当然,你也可以先用 AI 画一些气氛图出来,说不定能更进一步地激发你的灵感和创意。

不过,虽然 Clapper 的功能已经充分地考虑了做视频的需求,但是它的效果却有些差强人意。不仅画面中人物的动作有些「鬼畜」,不符合物理运动规律。视频的整体效果更像是会动的 PPT,缺乏镜头之间的转场和连续感,并且配乐也 AI 味十足,听起来没有旋律,还有些杂音。

可能生成式 AI 想要改变视频制作的流程,还需要很长时间,但 Clapper 的出现或许能给还在给传统视频剪辑软件拓展 AI 功能的大厂们,提供了一条新的落地思路。

参考内容:

https://news.ycombinator.com/item?id=41221399

https://x.com/aigclink/status/1818111874531205216


实力不靠吹骁龙8为AI做的这些幕后实事鲜为人知

“拍照优化、语音助手以外,手机AI还有什么?”今年全新一代骁龙8移动平台发布时,高通再次翻译翻译了,什么叫脑洞大开——让手机学会“听诊”,通过识别出用户可能存在的疾病,比如抑郁症、哮喘;让手机实现“防偷窥”,通过识别陌生用户的视线,实现自动锁屏;让手机游戏搞定超分辨率,将以往PC端才有能力运行的画质,搬到手机上体验更重要的是,这些AI功能,骁龙8有能力**同时运行**!高通声称,骁龙8搭载的第7代AI引擎,性能相比上一代最高提升了**4倍**。 这意味着我们玩手机的时候,同时“多开”几个AI应用也没问题。 更重要的是,它不仅仅是简单的AI性能提升,更能给用户带来流畅的应用体验感。 在硬件制程升级如此艰难的今天,高通是如何在第7代AI引擎的性能和应用上“翻”出这么多新花样的?我们翻了翻高通发表的一些研究论文和技术文档,从中找到了一些“蛛丝马迹”:在高通发布的AIMET开源工具文档里,就有提到关于“如何压缩AI超分辨率模型”的信息;在与“防偷窥”相关的一篇技术博客中,介绍了如何在隐私保护的前提下使用目标检测技术而这些文档、技术博客背后的顶会论文,全都来自一家机构——高通AI研究院。 可以说,高通把不少研究院发表的AI论文,“藏”在了第7代AI引擎里。 顶会论文“藏身”手机AI先来看看第7代AI引擎在**拍照算法**上的提升。 针对智能识别这个点,高通今年将面部特征识别点增加到了300个,能够捕捉到更为细微的表情变化。 但同时,高通又将人脸检测的速度提升了**300%**。 这是怎么做到的?在一篇高通发表在CVPR上的研究中,我们发现了答案。 在这篇文章中,高通提出了名为Skip-Convolutions(跳跃卷积)的新型卷积层,它能将前后两帧图像相减,并只对变化部分进行卷积。 没错,就像人的眼睛一样,更容易注意到“动起来的部分”。 这使得骁龙8在做目标检测、图像识别等实时检测视频流的算法时,能更专注于目标物体本身,同时将多余的算力用于提升精度。 可能你会问,这样细节的人脸识别对于拍照有什么用?更进一步来说,这次高通与徕卡一起推出了LeicaLeitz滤镜,用的是基于AI的智能引擎,其中就包括了人脸检测等算法,使得用户能更不经思考智能地拍出更具艺术风格的照片。 不止人脸检测,高通在智能拍摄上所具备的功能,还包括超分辨率、多帧降噪、局部运动补偿然而,在高分辨率拍摄中的视频流通常是实时的,AI引擎究竟如何智能处理这么大体量的数据?同样是一篇CVPR论文,高通提出了一个由多个级联分类器组成的神经网络,可以随着视频帧的复杂度,来改变模型所用的神经元数量,自行控制计算量。 面对智能视频处理这种“量大复杂”的流程,AI现在也能hold住了。 智能拍照以外,高通的语音技术这次也是一个亮点。 像开头提到的,第7代AI引擎支持用手机加速分析用户声音模式,以确定哮喘、抑郁症等健康状况的风险。 那么,它究竟是如何准确分辨出用户声音,而且又不涉及收录数据的?具体来说,高通提出了一种手机端的联邦学习方法,既能使用手机用户语音训练模型,同时保证语音数据隐私不被泄露。 像这样的AI功能,有不少还能在高通AI研究院发表的论文中找到。 同样也能寻到蛛丝马迹的,是开头提及的AI提升手机性能的理论支撑。 这就不得不提到一个问题:**同时运行这么多AI模型,高通究竟是怎么提升硬件的处理性能的?**这里就不得不提到高通近几年的一个重点研究方向**“量化”**了。 从高通最新公布的技术路线图来看,模型量化一直是AI研究院这几年钻研的核心技术之一,目的就是给AI模型做个“瘦身”。 由于电量、算力、内存和散热能力受限,手机使用的AI模型和PC上的AI模型有很大不同。 在PC上,GPU动辄上百瓦功率,AI模型的计算可以使用16或32位浮点数(FP16、FP32)。 而手机SoC只有几瓦功率,也难存储大体积AI模型。 这时候就需要将FP32模型缩小成8位整数(INT8)乃至4位整数(INT4),同时确保模型精度不能有太大损失。 以AI抠图模型为例,我们以电脑处理器的算力,通常能实现十分精准的AI抠图,但相比之下,如果要用手机实现“差不多效果”的AI抠图,就得用到模型量化的方法。 为了让更多AI模型搭载到手机上,高通做了不少量化研究,发表在顶会上的论文就包括**免数据量化**DFQ、**四舍五入机制**AdaRound**,以及联合量化和修剪技术**贝叶斯位**BayesianBits等。 其中,DFQ是一种无数据量化技术,可以减少训练AI任务的时间,提高量化精度性能,在手机上最常见的视觉AI模型MobileNet上,DFQ达到了超越其他所有方法的最佳性能:AdaRound则可以将复杂的Resnet18和Resnet50网络的权重量化为4位,大大减少了模型的存储空间,同时只损失不到1%的准确度:贝叶斯位作为一种新的量化操作,不仅可以将位宽度翻倍,还能在每个新位宽度上量化全精度值和之前四舍五入值之间的残余误差,做到在准确性和效率之间提供更好的权衡。 这些技术不仅让更多AI模型能以**更低的功耗**在手机上运行,像原本只能在电脑上运行的游戏AI超分辨率*(类似DLSS)*,现在实现能在骁龙8上运行的效果;甚至其中一些AI模型,还能“同时运行”,例如其中的姿态检测和人脸识别:事实上,论文还只是其中的第一步。 要想快速将AI能力落地到更多应用上,同样还需要对应的更多平台和开源工具。 将更多AI能力释放到应用上对此,高通保持一个开放的心态。 这些论文中高效搭建AI应用的方法和模型,高通AI研究院通过合作、开源等方法,将它们分享给了更多开发者社区和合作伙伴,我们也因此能在骁龙8上体验到更多有意思的功能和应用。 **一方面,高通与谷歌合作,将快速开发更多AI应用的能力分享给了开发者。 **高通在骁龙8上搭载了谷歌的VertexAINAS服务,还是每月更新的那种,意味着开发者在第7代AI引擎上开发的AI应用,其模型性能也能快速更新。 采用NAS,开发者就能自动用AI生成合适的模型,包括高通发表在顶会上的智能拍照算法、语音翻译、超分辨率都能包含在AI的“筛选范围”中,自动为开发者匹配最好的模型。 这里用上了高通的运动补偿和插帧等算法。 而类似于这些的AI技术,开发者们也都能通过NAS实现,还能让它更好地适配骁龙8,不会出现“调教不力”的问题。 想象一下,你将来用搭载骁龙8的手机打游戏时,会感觉画面更流畅了,但是并不会因此掉更多的电(指增加功耗):同时,关于AI模型的维护也变得更简单。 据谷歌表示,与其他平台相比,VertexAINAS训练模型所需的代码行数能减少近80%。 **另一方面,高通也已经将自己这些年研究量化积累的工具进行了开源。 **去年,高通就开源了一个名为AIMET*(AIModelEfficiencyToolkit)*的模型“提效”工具。 其中包含如神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法,有不少都是高通AI研究院发表的顶会论文成果。 开发者用上AIMET工具后,就能直接用这些算法来提效自己的AI模型,让它更流畅地在手机上运行。 高通的量化能力也不止开源给普通开发者,同样能让头部AI企业的更多AI应用在骁龙8上实现。 在新骁龙8上,他们与NLP领域知名公司HuggingFace进行合作,让手机上的智能助手可以帮用户分析通知并推荐哪些可优先处理,让用户对最重要的通知一目了然。 在高通AI引擎上运行它们的情绪分析模型时,能做到比普通CPU速度快30倍。 正是技术研究的沉淀和技术上保持的开放态度,才有了高通不断刷新手机业界的各种AI“新脑洞”:从之前的视频智能“消除”、智能会议静音,到今年的防窥屏、手机超分辨率还有更多的论文、平台和开源工具实现的AI应用,也都被搭载在这次的AI引擎中。 而一直隐藏在这些研究背后的高通AI研究院,也随着第7代AI引擎的亮相而再次浮出水面。 高通AI的“软硬兼备”大多数时候,我们对于高通AI的印象,似乎还停留在AI引擎的“硬件性能”上。 毕竟从2007年启动首个AI项目以来,高通一直在硬件性能上针对AI模型提升处理能力。 然而,高通在AI算法上的研究,同样也“早有筹谋”。 2018年,高通成立AI研究院,负责人是在AI领域久负盛名的理论学者MaxWelling,而他正是深度学习之父Hinton的学生。 据不完全统计,高通自成立AI研究院以来,已有数十篇论文发表在NeurIPS、ICLR、CVPR等AI顶级学术会议上。 其中,至少有4篇模型压缩论文已在手机AI端落地实现,还有许多计算机视觉、语音识别、隐私计算相关论文。 上述的第7代AI引擎,可以说只是高通近几年在AI算法研究成果上的一个缩影。 通过高通AI的研究成果,高通还成功将AI模型拓展到了诸多最前沿技术应用的场景上。 在自动驾驶上,高通推出了骁龙汽车数字平台,“包揽”了从芯片到AI算法的一条龙解决方案,目前已同25家以上的车企达成合作,使用他们方案的网联汽车数量已经达到2亿辆。 其中,宝马的下一代辅助驾驶系统和自动驾驶系统,就将采用高通的自动驾驶方案。 在XR上,高通发布SnapdragonSpacesXR了开发平台,用于开发头戴式AR眼镜等设备和应用。 通过和WannaKicks合作,骁龙8还将第7代AI引擎的能力带到了AR试穿APP上。 在无人机上,高通今年发布了FlightRB55G平台,其中有不少如360°避障、无人机摄影防抖等功能,都能通过平台搭载的AI模型实现。 其中首架抵达火星的无人机“机智号”,搭载的就是高通提供的处理器和相关技术。 回过头看,不难发现这次高通在AI性能上不再强调硬件算力(TOPS)的提升,而是将软硬件作为一体,得出AI性能4倍提升的数据,并进一步强化AI应用体验的全方位落地。 这不仅表明高通更加注重用户实际体验的感受,也表明了高通对自身软件实力的信心,因为硬件已经不完全是高通AI能力的体现。 可以说骁龙8第7代AI引擎的升级,标志着高通AI软硬一体的开端。 最近,高通针对编解码器又提出了几篇最新的研究,分别登上了ICCV2021和ICLR2021。 这些论文中,高通同样用AI算法,展现了针对编解码器优化的新思路。 在一篇采用GAN原理的研究中,高通最新的编解码器算法让图像画面不仅更清晰、每帧也更小了,只需要14.5KB就能搞定:相比之下,原本的编解码算法每帧压缩到16.4KB后,树林就会变得无比模糊:而在另一篇用插帧的思路结合神经编解码器的论文中,高通选择将基于神经网络的P帧压缩和插帧补偿结合起来,利用AI预测插帧后需要进行的运动补偿。 经过测试,这种算法比谷歌之前在CVPR2020上保持的SOTA纪录更好,也要好于当前基于H.265标准实现开源编解码器的压缩性能。 将AI模型应用于更多领域中,高通已经不是第一次尝试,像视频编解码器的应用,就又是一个新的方向。 如果这些模型能成功被落地到平台甚至应用上,我们在设备上看视频的时候,也能真正做到不卡。 随着“软硬一体”的方案被继续进行下去,未来我们说不定真能看见这些最新的AI成果被应用到智能手机上。 结合高通在PC、汽车、XR等领域的“秀肌肉”可以预见的是,你熟悉的高通、你熟悉的骁龙,肯定不会止于手机,其AI能力,也将不止于手机。

实力不靠吹骁龙8为AI做的这些幕后实事鲜为人知

1. “拍照优化、语音助手以外,手机AI还有什么?”今年全新一代骁龙8移动平台发布时,高通再次翻译翻译了,什么叫脑洞大开——让手机学会“听诊”,通过识别出用户可能存在的疾病,比如抑郁症、哮喘;让手机实现“防偷窥”,通过识别陌生用户的视线,实现自动锁屏;让手机游戏搞定超分辨率,将以往PC端才有能力运行的画质,搬到手机上体验更重要的是,这些AI功能,骁龙8有能力**同时运行**!2. 高通声称,骁龙8搭载的第世哪7代AI引擎,性能相比上一代最高提升了**4倍**。 这意味着我们玩手机的时候,同时“多开”几个AI应用也没问题。 更重要的是,它不仅仅是简单的AI性能提升,更能给用户带来流畅的应用体验感。 3. 在硬件制程升级如此艰难的今天,高通是如何在第7代AI引擎的性能和应用上“翻”出这么多新花样的?我们翻了翻高通发表的一些研究论文和技术文档,从中找到了一些“蛛丝马迹”:4. 在高通发布的AIMET开源工具文档里,就有提到关于“如何压缩AI超分辨率模型”的信息;5. 在与“防偷窥”相关的一篇技术博客中,介绍了如何在隐私保护的前提下使用目标检测技术;6. 这些文档、技术博客背后的顶会论文,全都来自一家机构——高通AI研究院。 可以说,高通把不少研究院发表的AI论文,“藏”在了第7代AI引擎里。 7. 顶会论文“藏身”手机AI先来看看第7代AI引擎在**拍照算法**上的提升。 针对智能识别这个点,高通今年将面部特征识别点增加到了300个,能够捕捉到更为细微的表情变化。 但同时,高通又将人脸检测的速度提升了**300%**。 8. 在一篇高通发表在CVPR上的研究中,我们发现了答案。 在这篇文章中,高通提出了名为Skip-Convolutions(跳跃卷积)的新型卷积层,它能将前后两帧图像相减,并只对变化部分进行卷积。 9. 这意味着骁龙8在做目标检测、图像识别等实时检测视频流的算法时,能更专注于目标物体本身,同时将多余的算力用于提升精度。 10. 可能你会问,这样细节的人脸识别对于拍照有什么用?更进一步来说,这次高通与徕卡一起推出了LeicaLeitz滤镜,用的是基于AI的智能引擎,其中就包括了人脸检测等算法,使得用户能更不经思考智能地拍出更具艺术风格的照片。 11. 不止人脸检测,高通在智能拍摄上所具备的功能,还包括超分辨率、多帧降噪、局部运动补偿等等。 12. 然而,在高分辨率拍摄中的视频流通常是实时的,AI引擎究竟如何智能处理这么大体量的数据?同样是一篇CVPR论文,高通提出了一个由多个级联分类器组成的神经网络,可以随着视频帧的复杂度,来改变模型所用的神经元数量,自行控制计算量。 13. 面对智能视频处理这种“量大复杂”的流程,AI现在也能hold住了。 智能拍照以外,高通的语音技术这次也是一个亮点。 14. 像开头提到的,第7代AI引擎支持用手机加速分析用户声音模式,以确定哮喘、抑郁症等健康状况的风险。 那么,它究竟是如何准确分辨出用户声音,而且又不涉及收录数据的?15. 具体来说,高通提出了一种手机端的联邦学习方法,既能使用手机用户语音训练模型,同时保证语音数据隐私不被泄露。 16. 这些技术不仅让更多AI模型能以**更低的功耗**在手机上运行,像原本只能在电脑上运行的游戏AI超分辨率*(类似DLSS)*,现在实现能在骁龙8上运行的效果;17. 甚至其中一些AI模型,还能“同时运行”,例如其中的姿态检测和人脸识别。 18. 事实上,论文还只是其中的第一步。 要想快速将AI能力落地到更多应用上,同样还需要对应的更多平台和开源工具。 19. 将更多AI能力释放到应用上对此,高通保持一个开放的心态。 这些论文中高效搭建AI应用的方法和模型,高通AI研究院通过合作、开源等方法,将它们分享给了更多开发者社区和合作伙伴,我们也因此能在骁龙8上体验到更多有意思的功能和应用。 20. **一方面,高通与谷歌合作,将快速开发更多AI应用的能力分享给了开发者。 **高通在骁龙8上搭载了谷歌的VertexAINAS服务,还是每月更新的那种,意味着开发者在第7代AI引擎上开发的AI应用,其模型性能也能快速更新。 21. 采用NAS,开发者就能自动用AI生成合适的模型,包括高通发表在顶会上的智能拍照算法、语音翻译、超分辨率都能包含在AI的“筛选范围”中,自动为开发者匹配最好的模型。 22. 这里用上了高通的运动补偿和插帧等算法。 而类似于这些的AI技术,开发者们也都能通过NAS实现,还能让它更好地适配骁龙8,不会出现“调教不力”的问题。 23. 想象一下,你将来用搭载骁龙8的手机打游戏时,会感觉画面更流畅了,但是并不会因此掉更多的电(指增加功耗)。 24. **另一方面,高通也已经将自己这些年研究量化积累的工具进行了开源。 **去年,高通就开源了一个名为AIMET*(AIModelEfficiencyToolkit)*的模型“提效”工具。 25. 其中包含如神经网络剪枝、奇异值分解(SVD)等大量压缩和量化算法,有不少都是高通AI研究院发表的顶会论文成果。 26. 开发者用上AIMET工具后,就能直接用这些算法来提效自己的AI模型,让它更流畅地在手机上运行。 高通的量化能力不止开源给普通开发者,同样能让头部AI企业的更多AI应用在骁龙8上实现。 27. 在新骁龙8上,他们与NLP领域知名公司HuggingFace进行合作,让手机上的智能助手可以帮用户分析通知并推荐哪些可优先处理,让用户对最重要的通知一目了然。 28. 在高通AI引擎上运行它们的情绪分析模型时,能做到比普通CPU速度快30倍。 29. 正是技术研究的沉淀和技术上保持的开放态度,才有了高通不断刷新手机业界的各种AI“新脑洞”:从之前的视频智能“消除”、智能会议静音,到今年的防窥屏、手机超分辨率还有更多的论文、平台和开源工具实现的AI应用,也都被搭载在这次的AI引擎中。 30. 而一直隐藏在这些研究背后的高通AI研究院,也随着第7代AI引擎的亮相而再次浮出水面。 高通AI的“软硬兼备”大多数时候,我们对于高通AI的印象,似乎还停留在AI引擎的“硬件性能”上。 31. 毕竟从2007年启动首个AI项目以来,高通一直在硬件性能上针对AI模型提升处理能力。 32. 然而,高通在AI算法上的研究,同样也“早有筹谋”。 2018年,高通成立AI研究院,负责人是在AI领域久负盛名的理论学者MaxWelling,而他正是深度学习之父Hinton的学生。 33. 据不完全统计,高通自成立AI研究院以来,已有数十篇论文发表在NeurIPS、ICLR、CVPR等AI顶级学术会议上。 34. 其中,至少有4篇模型压缩论文已在手机AI端落地实现,还有许多计算机视觉、语音识别、隐私计算相关论文。 35. 上述的第7代AI引擎,可以说只是高通近几年在AI算法研究成果上的一个缩影。 36. 通过高通AI的研究成果,高通还成功将AI模型拓展到了诸多最前沿技术应用的场景上。 37. 在自动驾驶上,高通推出了骁龙汽车数字平台,“包揽”了从芯片到AI算法的一条龙解决方案,目前已同25家以上的车企达成合作,使用他们方案的网联汽车数量已经达到2亿辆。 38. 其中,宝马的下一代辅助驾驶系统和自动驾驶系统,就将采用高通的自动驾驶方案。 39. 在XR上,高通发布SnapdragonSpacesXR了开发平台,用于开发头戴式AR眼镜等设备和应用。 40. 通过和WannaKicks合作,骁龙8还将第7代AI引擎的能力带到了AR试穿APP上。 41. 在无人机上,高通今年发布了FlightRB55G平台,其中有不少如360°避障、无人机摄影防抖等功能,都能通过平台搭载的AI模型实现。 42. 其中首架抵达火星的无人机“机智号”,搭载的就是高通提供的处理器和相关技术。 43. 回过头看,不难发现这次高通在AI性能上不再强调硬件算力(TOPS)的提升,而是将软硬件作为一体,得出AI性能4倍提升的数据,并进一步强化AI应用体验的全方位落地。 44. 这不仅表明高通更加注重用户实际体验的感受,也表明了高通对自身软件实力的信心,因为硬件已经不完全是高通AI

服装行业会用到的AI工具分享

绘画AI

Midjourney

Stable Diffusio

文心一格

目前最强的AI绘画工具

最强开源AI绘画工具

网络出品的AI绘画工具

效果惊人!内置5种模型的AI

用AI生成惊艳的艺术品

OpenAl出品的绘画工具

图像生成器

Scribble Diffus

Artbreeder

AI图像生成+SD提示词

有趣!将鼠绘草图变成精美

在线AI图像合成创意工具

照片

Adobel Firefly

NVIDIA Canvas

Adobe旗下的创意生成模

Canva的免费AI绘画工具

用AI将简单的勾勒转化成逼

型,数字创意行业新宠

真的图像

AI绘画专题

NijiJourney

AI艺术共享平台!海量SD开

推荐!为您精选AI绘画有关

MJ出品!面向二次元风格,

源模型

的神器和介绍

内容细致拿捏专业到位

HuggingFace

Tiamat微博

下载开源的SD模型

国内自研的AI作画系统!内

知名站点Deviantart发布的

测中

AI绘画工具

AI提示词

PromptHero

Prompt Hunt

PromptBase

推荐!最受欢迎的AI提示词

按主题分类的SD提示词

AI提示词交易网站

网站

ClickPrompt

Visual Prompt

一款专为Prompt编写者设

艺术风格流派参考库

涨姿势系列!设计绘画风格

计的工具

参考

MJ Prompt To

Learning Prom

PromptoMania

MJ提示词创造助手

ChatGPT提示词中文指南

MJ和SD提示词生成器

PublicPrompts

CLIP Interrogai

Ordinary Prom

Al绘画模型+风格参考

反向学习!从图片反推AI关

有趣ChatGPT提示词

键词

图像处理

多合一AI图像处理网站,快

腾讯出品的图片处理工具

推荐!专业的AI抠图修图,

速进行编辑修整

支持格式转化

Restorephoto

美图AI开放平台

用Al为黑白照片着色

用AI修复旧的人像照片

美图推出的AI人脸图像处理

平台

Vectorizer

使用轻松!一键无痕抹除画

超实用!消除或替换图像背

免费使用!一键将位图转为

面内容

景的AI工具

矢量图

Change Style

一键生成动漫二次元头像

人工智能多风格肖像生成

模糊图片秒变超清!开源免

器!能够AI生成30种照片

费Al图片无损放大工具

美图云修

MagicStudio

图片处理必备效率神器!为

免费的AI人像生成图片素材

商业级AI影像处理工具

你的图片提供神奇魔法

网站

RestorePhotos

效果惊艳的AI修复面容模糊

一键修复,让您的老照片变

Al图片在线无损放大

的照片

新照片

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://m.srwj168.com.cn/keji312/14382.html
贝壳大涨!期待小米
超越Llama 非Transformer架构站起来了 首个纯