本周科技圈:Claude Code 又进化了,500 刀显卡追平 Claude
🔥 重磅
Apple 正式砍掉 Mac Pro
苹果 discontinues 了 Mac Pro。对,就是那台能装双 CPU、扩展卡插满的”巨无霸”。
说实话不意外。Apple Silicon 路线下,Mac Studio 已经能满足 99% 专业用户的需求,Mac Pro 的模块化设计跟苹果”封死一切”的产品哲学越来越拧巴。留下的缺口?可能是那台传说中的 Mac Studio Ultra。
对开发者的影响:基本没有。该买 Studio 买 Studio。
$500 显卡跑分追平 Claude Sonnet
一个叫 ATLAS 的开源项目上了 HN 热榜第一——500 美金的消费级 GPU,在 coding benchmark 上追平了 Claude Sonnet。
HN 上吵翻了。有人说” benchmarks 不等于实际体验”,也有人说”这就是开源的意义——让 AI 能力民主化”。
我的看法:追平 Sonnet 的 benchmark 不等于追平 Sonnet 的实际体验,但这确实是开源社区追上闭源 API 的信号。半年前想都不敢想。
🤖 AI
Agent-to-Agent 结对编程
Axel Delafosse 写了一篇博客,演示两个 AI agent 互相结对写代码。一个负责写,一个负责 review,循环迭代直到代码质量达标。
这个思路有意思的地方在于:它绕过了”AI 生成代码质量不够”的问题——与其让一个 AI 输出完美代码,不如让两个 AI 互相纠错。
Claude Code 已经内置了 Subagents 系统,可以自动调用专业子代理做 code review、debug 等任务。agent-to-agent 的时代已经开始了,只是大多数人还没意识到。
ARC-AGI-3 首日 36% 通过率
Symbolica 团队在 ARC-AGI-3 测试首日就拿到了 36% 的分数。ARC-AGI 被认为是测试 AI “通用推理能力”的标杆,之前大多数模型在 10% 以下挣扎。
36% 说明什么?AI 的抽象推理能力在快速提升。但 64% 还是答不对,说明距离”真正的理解”还有很大距离。
Claude Code 支持定时任务
Claude Code 现在可以在网页端设置定时任务了。比如每天早上 8 点自动跑测试、每周五自动生成周报。不用你手动触发,它自己按时干活。
🛠️ 工具
用 DNS 跑 DOOM
有人在 DNS 协议上跑通了 DOOM。对,就是那个域名解析的 DNS。每一帧通过 DNS 查询传输。
这种”在奇怪的地方跑 DOOM”的传统已经有 20 年了(烤面包机、ATM 机、怀孕测试棒……),但 DNS 版本还是让我乐了一下。
用 $7/月的 VPS 搭 AI Agent
一个开发者把 AI agent 部署到了月费 7 刀的 VPS 上,用 IRC 当通信层。没有 fancy 的 Web UI,没有昂贵的 API 调用费,就是一个在 IRC 频道里跟你聊天的 bot。
这是 AI agent 走向”基础设施化”的一个信号——AI 不再是 SaaS 产品的特权,而是任何人都能在廉价服务器上跑的东西。
📊 一个数据
旧手机回收价格暴涨 6 亿热度。1 吨旧手机约能提炼 200 克黄金。
看完这个数据,我默默打开了抽屉里的旧手机盒子。
下周关注
- WWDC 日期预计下周公布(Mac Pro 停产之后,苹果的开发者大会更有意思了)
- GPT-5 发布日期传言不断,密切关注
- 开源模型的 coding benchmark 竞赛越来越激烈
评论区