这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
智谱刚刚发布了 GLM-4.7,他们在某些 benchmark 上是最好的开源模型,而且和 Claude Sonnet 4.5 一样强。 值得一提的是,GLM-4.7 提供了多种思考模式,可以在对话中按轮次切换是否启用思考,还将「交错式思考」升级为「保留式思考」,让复杂任务的连续推理更稳定。
本文整理自[AIGO小酒馆]分享内容话题内容:CLI的产品美学: 时代在倒退么?CLI的技术原理:Single Agent vs Multi ...
大家好,我是爱折腾“歪脖扣定”的冷逸。马上圣诞节到了,先给大家表演一个隔空抓娃娃。需要这个HTML的朋友,可以在后台私信【抓娃娃】领取。只要电脑有摄像头,用浏览器打开就能玩。怎么做的呢?用MiniMax最新的M2.1模型+Claude ...
The World Resources Institute (USA) Beijing Representative Office is looking for one highly self-motivated student to be an intern at the Research, Data & Impact (RDI) team.
随着 AI 技术的进步,那边在 OpenAI 大杀四方、用 Sora 彻底革了视频的命之际,这边的微软悄然对传统用户界面“出招”,最新带来一款用于构建用户界面(UI)交互智能体的 Agent 框架——UFO,能够快速理解和执行用户的自然语言请求,它的发布也向外界展示了未来与 Windows 交互是多么的容易。
刚过完自己 69 岁生日的两个月后,Java 之父 James Gosling(詹姆斯·高斯林)在领英上官宣了自己退休的消息。他表示,“ 我终于退休了。在做了这么多年软件工程师之后,是时候让我好好玩玩了。尽管受到了 COVID-19 和工业环境的影响,但在亚马逊的过去 7 年还是非常美好的。 ” ...