机器之心原创
机器之心编辑部
奇怪了。
一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。
10 月 24 日,阿里旗下的通义正式宣布了「代码模式」,并开放试用预约,首批邀请 1024 名用户进行体验。
通义代码模式旨在降低应用开发的门槛。它针对简单的代码和应用生成需求,主打一个所见即所得。
具体来说,人与 AI 大模型的交流现在会出现在一个专门的窗口里,AI 大模型生成的代码会实时地在网页上跑出来以供预览。
因此,非专业程序员优先是本次测试的特别要求。
这是国内首家实现「让使用者一句话编程,并实时生成可见预览」的公司 ,通义代码模式的出现,或许代表着一种未来新趋势。
言听计从,不用吵架
24 小时随时等需求的「贴身程序员」来了
最近一段时间,大模型技术正在加速进入下半场。各家科技巨头、AI 创业公司在发展新一代模型的同时,也在不断探索大模型的应用方式。
上周,消费级产品领域曝出了一系列新产品,微软发布的「商业智能体」旨在包揽人们在销售、客服、财务、供应链团队的工作;Anthropic 提出的升级版 Claude 3.5 Sonnet 则主打一个「AI 自己操纵电脑」;在手机端,荣耀提出智能终端的「自动驾驶」,似乎让手机具备了全局跨 App 自动操纵的能力。
通义代码模式,则预示着在生产的一侧,开发领域的新一轮迭代。
在实时可预览代码模式出现之前,我们即使是使用 ChatGPT 等行业顶尖的大模型来写代码,也必须遵循这样的路径:1)先想好与 AI 沟通的措辞提出需求;2)复制 AI 生成的代码,尝试在外部开发环境中运行;3)继续追问大模型,不断修改代码并尝试运行,直到最终获得满意的结果为止。
现在有了通义代码模式,你在叙述完具体功能需求后,系统会创建一个工作空间,AI 在其中与你协同工作。在后续对话过程中,AI 可以实时查看你的新要求,持续编辑代码。问题随时解决,效果实时呈现,就像是在现实世界中的多人协作一样。
而且,AI 还永远不会与你 battle。
ChatGPT 刚刚爆发时人们曾预测,AI 大模型先解放的将会是软件开发。现在看来,我们距离实现这个理想又更近了一步。
我们看到,使用通义代码模式可以捣鼓出各种不同的应用。比如生成一个贪吃蛇小游戏:
带有一定复杂规则的格斗游戏:
甚至还有音乐播放器:
通义产品经理王晓明表示,代码模式的提出主要是来自于用户需求。通义大模型的代码能力属于业界领先,每天有大量程序员在使用通义进行代码生成和代码解释等任务。此外,他们发现还有不少不懂代码的用户会有创建应用、网页等需求。
与通义灵码、AI 程序员主要面向资深程序员的深度编码场景不同,通义代码模式提供了一种新的交互方式,针对简单的代码和应用生成需求,为用户创建一个动态的窗口,将生成的代码文件直接在网页上渲染成应用。
从「通义灵码」到「AI 程序员」再到「通义代码模式」到底迭代了什么?至此,答案就呼之欲出了:
「这相当于让用户拥有一个 24 小时随时提需求的『贴身程序员』,不用排期、随时上线,且能满足你专属需求。」王晓明类比说。他还透露,阿里内部的开发者每天都在让通义协助完成大量的代码任务,从简单的代码排查、生成和解释,到更深入的代码文件辅助生成。「有些同事甚至直接用通义代码模式复刻出了小时候玩的掌机、小霸王上的一些小游戏,比如坦克大战、俄罗斯方块、飞机大战等。」
基于 Qwen 2.5
通义代码模式还在持续进化
任何一款好用的 AI 产品都离不开背后足够聪明的大模型,通义代码模式也是如此。它基于 Qwen 2.5 大模型进行开发。如果你一直在关注大模型领域的动态,会发现 Qwen 大模型最近的热度正在持续提高。
在 9 月底,全球开源社区基于 Qwen 系列二次开发的衍生模型数量已经超过了 Llama 系列,达到了 7.4 万。 在 LiveBench 排行榜上,该模型的编码能力得分超过了 OpenAI 的 o1 模型,曾经跻身排行榜第二。在 Chatbot Arena 榜单上,该模型也能排到第五。
而且除了跑分,这个模型在国内外开发者中的口碑也非常好。
无论是在性能方面,还是在影响力方面,Qwen 都已经获得了充分的认可。
通义代码模式的出现,则让 Qwen 2.5 在多个方面充分发挥了自己的潜力。具体来说,代码模式一方面需要基于模型的意图识别和指令理解能力,将涉及到代码的用户意图精准识别出来,另一方面也需要将代码生成能力进行提升。有了 Qwen 2.5 做基础,通义代码模式在代码生成、推理和修复等能力方面表现非常优秀,能够支持 40 多种编程语言。
此外,通义代码模式的代码能力相比常规模式有 30% 以上的显著提升,在代码场景下表现极为优秀的同时,也具备很强的数学和通用能力。
在完成意图的理解和代码的生成之后,通义代码模式还需要将代码文件渲染成小游戏、网页和数据图表等各类应用,并且支持直接对代码的编辑修改(如转换语言、添加注释、问答等)。
这其中最大的难点就在代码渲染层面。为了尽可能扩大代码成功渲染为各类应用的范围,通义的团队需要对用户需求进行深入调研,并且针对主要的几大类场景进行优化,以确保满足用户的实际使用需求。其中涉及到意图理解、模型调优、前端渲染组件适配等一系列复杂的工作。
王晓明表示,通义代码模式目前可以实现大多数只依赖前端渲染的应用生成任务,对于更复杂的前后端代码,目前可以实现长篇的代码片段生成作为辅助。未来,该模式会进一步与 IDE 进行深度结合,帮助用户完成更加完整的前后端系统代码生成,实现更加复杂的应用类型生成。
这才是未来 AI 该有的样子?
通义代码模式选择的人机交互范式,可谓如今各路大模型公司主攻的新方向。
从理念上来说,这一模式与国外知名 AI 公司 Anthropic 提出的新功能 Artifacts 以及 OpenAI 发布的 ChatGPT with Canvas 不谋而合。或者,从某种程度上来说,通义代码模式更像是集合了二者的优势。
Artifacts 的最大特点在于实时预览。长期以来,大型语言模型一直能够生成代码,但在 GitHub 和 Copilot 等人工智能辅助开发环境之外,执行生成的代码通常需要额外的步骤。这些步骤让开发人员感觉繁琐,也把非开发人员挡在了门槛之外。在单独的窗口中保存和运行代码,可以带来方便、即时的体验。同样,在生成图像和其他可视化输出时也是如此。
所以,在 Artifacts 问世之际,很多人将其称为「本年度最重要的 AI 功能」、「Claude AI 最有用的功能」…… 还有人评价说,它「比 GPT-4o 还要震撼,这才是未来 AI 的样子」。
不过,Artifacts 也有一些不方便的地方,比如对于编程语言之间的自动转换、注释的添加还没有做到很好的支持。OpenAI 随后发布的 ChatGPT with Canvas 倒是提供了这些功能,但并不支持代码预览和应用生成,前面提到的种种问题依然存在。
通义代码模式更像是二者的结合体。它能够实现类似 Claude Artifacts 的代码生成和预览功能,并且还支持 Claude 不具备的代码编辑、添加注释、转换语言等功能,可以一步到位实现小游戏、网页、数据图表等各类应用的预览和使用,所触及的人群更加广泛。
同时,为了让那些不会写指令的用户直接创建应用,通义代码模式预置了一批提前生成好的小游戏和应用,用户可以直接使用。如果需要修改,用户只需要简单改一下指令,就能生成符合自己需要的应用。
如果说,未来的人类社会不可避免地走向人机协作,那么真正的挑战不仅在于如何打造更智能的 AI,还在于如何让这种智能易于获取、直观自然,并能无缝融入现有的工作流程。
在大模型之争的上半场,大多数企业都在关注前者。如今到了下半场,关注后者的企业将变得越来越多,OpenAI、Anthropic、阿里通义都属于行动较早的那一拨。
最后,关于「为什么要招募不懂代码的用户做测试」,王晓明回答说,「不懂代码的人更关注的是能否使用 AI 生成自己需要的各类应用,比如搭建个人博客、生成贪吃蛇小游戏、编写数据图表等,甚至还有用户希望用通义来生成一个表白网站的。对于这些用户来说,更重要的是应用生成的简便程度和可用性,而不是底层的代码实现逻辑。」
从实际使用场景出发,只需要用「大白话叙述」就能构建起符合我们需要的应用,这样的工具才是真正能够提升效率的工具,能够让更多的人用起来。
因此,「通义代码模式」用户的大头可以不是程序员,可以是学生、老师、数据分析师,自媒体从业者…… 测试者自然要更贴近这些人。
听起来,这会是一场非常有趣的测试,得到的洞察也会非常丰富。
如果你也想参与测试,可以在通义 App 或者通义 PC 页面对话框输入「1024」进行预约。 期待大家的测试反馈。
有哪些老程序员都知道对新手很有用的经验?
一说到程序员,想必大家的第一印象就是头发少,很大程度上就是因为压力大导致的,有生活压力,也有工作压力。
今天说说工作方面的压力,想必看到这个问题的小伙伴都有一个认知,就是一个项目往往比预期的要长,说不败培雀定从哪天开始就加班了,一出现BUG真的中指要人命。 此时,考研新老选手心态的时候和经验的时候了,老程序员或许能从容应对,新手可能完全不知错所。
笔者也有一些老程序员朋友,今天结合朋友和网上的资料特意为各位新手准备了下面的一些经验:
一、怎么初步判断谁不是高手
跟有经验、有能力的人学习是让自己技术快速成长最好的方法,但新手往往是无法辨别真相的,老程序员认为,到了一个新环境,不要立刻对同事下结论。 我们会发现,一些人很能讲,有非常多的建议和意见题,对于各种问题也非常热情去解答,但旺旺这样的人并不一定是真正的高手。
二、什么是优秀的程序员
首先,一个优秀的程序员,不管你的代码是什么风格,一定要非常清晰,非常有条理,而且要有完善的注释。 其次,看一个程序员是否有实力,还要看这个人对信息的敏感度和热爱度。 做编程最怕的就是停止学习,因为不进则退。 最后,善于接受新工具和新技术。 编程行业,是在时刻发展的,特别是最近几年,发展速度极快,各种工具和方法层出不穷,新手肯定无法那么快适应,但你要有这个思想,守着学校里学的一亩三分地,早晚会被淘汰。
三、学会向上反馈
程序员每天和代码打交道,问题和压力会时常出现的,这是行业特性所决定的,我们无法避免,不能避免怎么办?最好的办法是向上反馈。 当这个问题怎么想也想不明白,问人也无法解决,此时把这件事和领导讲清楚,让他们帮助你或提供资源。
作为一名程序员,千万不要和自己较劲,不要做失去理性的程序员。
四、要有自己的原则
作为一名优秀的程序员察早,必定有一套自己的行事准则,但我说的准则不是你耍脾气耍个性哦。
原则是一种看不见摸不着的东西,不过遇到问题的时候,它会成为一个灯塔,不会让你的思想摇摆不定,因为你有自己的一套判定标准。 比如你认为“方向错了,停下来就是进步”,遇到方向性错误的时候,你会选择不断优化代码,而不是东改改西改改。
五、每行新代码至少执行一次
某项功能真正完成之前,一定要对其进行测试,千万不要忘了。 不然,你怎么知道它是不是按照自己的逻辑在执行?一般情况下,最好就是进行自动测试,但也不是绝对的。
六、要坚信BUG是不可避免的
有些人喜欢大谈代码,这个项目简直轻而易举,易如反掌。 作为一名新手你要相信,这种谈论没有意义,不论你再厉害,bug总是难免的。 最好的办法是做出一个系统,可以快速排除故障、修复bug并部署修复。
七、个人信息一定要保管好
这些信息包括户口档案、社保、公积金等信息,程序员新手可能跳槽比较频繁,有人甚至还换个城市工作。 除了户口可能其他的信息都乱了,可能当时觉得不那么重要,但是十年、二十年后,可能会非常重要。
八、几条名言
·工作日志可以提升脑容量;
·不要先写框架再写实现,要反过来;
·重构/优化/修复Bug,不要同时做;
·简化开发流程,加快迭代速度;
·纸笔是最好的工具,其次是markdown;
·画出结果,一目了然。
·首选明文文本,二进制、加密、压缩等到时候再加;
·要学会进行清晰的命名;
·问问题前先调查,要问到点上。
·不要小看程序员
为什么选择软件测试开发
坦白的讲,刚开始我也不知道。 但现在有一些感触,觉得有必要将“软件测试”继续下去。 先说说软件测试的现状吧! 很多公司都会招聘大专生来做测试,测试工作门槛低,谁辩郑枝都能做。 测试工作,就是别人把软件创造出来后,用一下;或者别人写完代码后,将东西扔过来验证一下,测试人员就是帮着开发人员打打下手。 测试工作做好做坏,没有人关心,或者测试人员到底做什么,也没有人关心。 这就是国内大部分公司的现状,也许有些公司说测试要保证产品质量,测试人员很重要。 只是口头上说说而已,而从实际行动上,当然是开发第一,测试第n。 实际行动丛局有哪些?很多:待遇、测试人员的来源、培训的机会、工作的分工、多方矛盾的化解,等等。 为什么会出现这种现象? 原因之一:软件产品成熟度的问题。 记得产品的竞争力分为多个层次:人无我有、人有我优、人优我廉、人廉我转。 先保证产品存在,然后谈产品的质量,质量好价格低的产品更畅销,质量好、价格低、服务好是用户追求的目标。 以前的软件大多属于形象工程,有就行了。 现在越来越多的软件用起来了,质量自然提上了日程。 怎无奈,花钱的客户不是使用产品的用户,客户不懂产品质量,但他懂价格,导致的问题就是让开发商拼价格,降低成本。 如果有一天,产品的质量对于软件的销售起决定作用的时候,开发商才会想办法提升质量。 原因之二:软件的质量并不完全依赖于测试水平。 软件的缺陷是由开发人员引入的,如果少一点引入缺陷,即使没有测试,软件的质量也会很高。 这是一个不错的观点。 开发人员自身水平的提升对产品质量的影响是第一位的。 ok,站在这个角度来讲,测试人员的存在是对产品质量提升的一个补充。 原因之三:测试人员没有争取。 测试人员往往在公司的位置较低,同时他们却选择了逆来顺受,听之任之的态度。 大多数软件测试人员的水平的携敏确不行,连代码都看不懂,与开发人员根本没有办法交流,当然开发人员瞧不起你。 原因之四:高水平的测试人员都不做测试。 水平高了,为了追求好的待遇,转开发了、做管理了,让自己的测试技能浪费了。 那“软件测试”还有救吗?是不是命中注定就是软件开发的“次要角色”?先提一些观点。 1、软件产品的质量越来越重要,而且是个趋势。 ——应该没有人反对吧! 2、为了保证产品的质量,有两条路可以走。 第一预防,让错误少出现;第二验证,如果有错误,发现、处理。 第一条路的主人公是开发人员。 第二条路的主人公是开发人员和测试人员。 测试人员的位置就是通过验证的方式去发现问题。 而这两条路相互补充,在整个开发过程不会舍弃其一。
新媒体运营日常工作是怎样的?
很多人认为新媒体运营,不就是“小编”?逛网站东看看西瞧瞧,写写字轻轻松松就把工作KO了,有啥难度?新媒体从业者在听到这样的“评价”时,真的拎起板砖的冲动都有了!
今天,我必须为新媒体运营正名!
新媒体工作核心围绕着内容运营而展开的~优质内容需要经过哪些历程基磨才能产出呢?即新媒体运营人员的工作日常是怎样的?现在让我们一起来看看:
1.确定选题
这是一个让无数新媒体人脑壳头的点——写啥?写啥?写啥?在毙稿之前,日常经历n次毙选题。
2.素材搜集
内容运营不只是单纯地码字发文,有时候需要发不同的形式内容,比如图文、视频、音频......因此我们需要围绕主题搜索相关素材图片、视频、音频等,这就考验素材搜集能力了。
3.内容编辑
围绕核心选题写稿、反复改稿,直至定稿...
4.图文排版
只会写不顶事儿,还要排版!排版最大的问题就是容易“牵一发而动全身”,所以改排版改到崩溃也是日常抓狂的事。
5.封面配图
一篇文章展现在用户眼前,除了标题外就是封面配图了,用户通过封面图可以了解你所想要传达的是哪方面的内容。
6.内容校对
发布的内容有错别字或者是排版问题等等,就等着被用户和老板骂吧....所以,在发布前的校稿工作必!须!谨!慎!
7.推送发布
根据人群决定推送发布渠道以及方式。
8.监测数据
发布后要时刻观察数据反馈,总结出问题所在,以便其他部门工作时给出数据支持。
9.处理留言
归纳总结用户留言内容,发掘用户的关注点,顺便充当知心小姐姐处理用户的问题。
10.用户反馈互动
和用户互动,保持用户的粘性,让他把你这个号,放心尖尖儿上。
以上野锋码便是新媒体运营日常且周而复始的工作。颂哪大家对它有新的认识了吗?