Horizon Summary: 2026-05-13 (ZH)

From 123 items, 54 important content pieces were selected

dnsmasq 六项严重 CVE 暴露内存安全问题 ⭐️ 9.0/10
谷歌推出新一代 TPU，专为 AI 智能体和模型训练设计 ⭐️ 9.0/10
SpaceX 发布星舰 V3，搭载 Raptor 3 引擎并增强热防护 ⭐️ 8.0/10
Needle: 26M 参数的设备端工具调用模型 ⭐️ 8.0/10
用散射模型渲染天空、日落和行星 ⭐️ 8.0/10
DuckDB 推出 Quack 协议实现远程访问与横向扩展 ⭐️ 8.0/10
Obsidian 推出自动化插件审核系统 ⭐️ 8.0/10
Bambu Lab 被指滥用开源社会契约 ⭐️ 8.0/10
EFF 主张边境无证搜查电子设备违反第四修正案 ⭐️ 8.0/10
AI 编程代理必须按比例降低维护成本 ⭐️ 8.0/10
你的 AI 使用正在毁掉我的大脑：僵尸互联网 ⭐️ 8.0/10
Shopify 的 River 代理在 Slack 上公开编码 ⭐️ 8.0/10
机器思维公司的 TML-Interaction-Small 276B-A12B 模型在实时语音领域刷新 SOTA ⭐️ 8.0/10
参数高尔夫：AI 辅助研究竞赛的洞察 ⭐️ 8.0/10
OpenAI 推出企业 AI 部署公司 DeployCo ⭐️ 8.0/10
探讨将 dma-buf 用于用户空间读写操作 ⭐️ 8.0/10
将透明大页扩展到 1GB ⭐️ 8.0/10
两个稳定内核发布，修复 Dirty Frag 漏洞 ⭐️ 8.0/10
Debian 强制要求可重现构建以进入测试 ⭐️ 8.0/10
OpenViking 让 AI 智能体学会记仇和伪装意图 ⭐️ 8.0/10
OpenAI WebSocket 模式将代理延迟降低 40% ⭐️ 8.0/10
知名开源作者呼吁验证软件供应链 ⭐️ 8.0/10
谷歌在 Next 26 大会宣布推出 GKE Agent Sandbox 和 Hypercluster ⭐️ 8.0/10
从 Redis 到 Valkey：开源社区的快速创新 ⭐️ 8.0/10
攻击者在 Flippa 购买 30 个 WordPress 插件植入后门 ⭐️ 8.0/10
Redis 与野心的代价 ⭐️ 8.0/10
Go 库 fsnotify 因维护者权限变更引发供应链警报 ⭐️ 8.0/10
Android 16 VPN 泄露漏洞未获谷歌修复 ⭐️ 8.0/10
Trail of Bits 分叉 Go 工具链以增强模糊测试能力 ⭐️ 8.0/10
Mythos AI 发现 curl 漏洞，但炒作受质疑 ⭐️ 8.0/10
Ratty：支持内联 3D 图形的 GPU 渲染终端模拟器 ⭐️ 8.0/10
在 AI 时代重新审视“没有银弹” ⭐️ 8.0/10
GitHub 克隆项目旨在恢复 Bambu Lab 打印机网络支持 ⭐️ 7.0/10
资深开发者为何难以传达专业经验 ⭐️ 7.0/10
Datasette 1.0a29 发布，修复段错误并改进 UI ⭐️ 7.0/10
Hashimoto：技术决策者跟风是为了不被解雇 ⭐️ 7.0/10
LLM 0.32a2 增加 OpenAI 推理端点支持 ⭐️ 7.0/10
GitLab 为‘代理时代’重组并裁员 ⭐️ 7.0/10
在脚本 shebang 行中使用 LLM ⭐️ 7.0/10
质疑 AI 微调的未来 ⭐️ 7.0/10
中国开放 AI 生态的复合优势 ⭐️ 7.0/10
使用 4KB 内核实现 64KB 页面的两种方法 ⭐️ 7.0/10
Cortex 智能代理赋能 Snowflake Intelligence 构建企业 AI 平台 ⭐️ 7.0/10
实时交互 AI 模型挑战 ChatGPT 回合制 ⭐️ 7.0/10
火山引擎 OpenViking：面向 AI Agent 的上下文数据库 ⭐️ 7.0/10
平台工程三大支柱的良性循环 ⭐️ 7.0/10
Kubernetes 上 AI 智能体安全：信任、密钥与可观测性 ⭐️ 7.0/10
Claude Code 忽略 CLAUDE.md 导致额度浪费 ⭐️ 7.0/10
Rockstar 如何将城市塞入 PS2 的 32MB 内存 ⭐️ 7.0/10
Rust 代码 mock 方法大全 ⭐️ 7.0/10
消除 Cow 使 JSON 格式化器提速 42% ⭐️ 7.0/10
2026 年 Zig 与 Rust 对比：演变与权衡 ⭐️ 7.0/10
Guix 宣布跨频道时间旅行 ⭐️ 7.0/10
代理式编码是一个陷阱 ⭐️ 7.0/10

dnsmasq 六项严重 CVE 暴露内存安全问题 ⭐️ 9.0/10

CERT 协调中心宣布了 dnsmasq（一个广泛使用的 DNS/DHCP 服务器）中的六项严重安全漏洞（CVE）。这些漏洞涉及内存安全问题，可能导致远程代码执行或拒绝服务。 dnsmasq 存在于无数家用路由器、物联网设备和安卓手机中，使得这些漏洞影响极为广泛。这一消息强调了将网络基础设施软件从 C 等内存不安全语言迁移到内存安全替代语言的紧迫性。这六项 CVE 尚未完全公开，但被描述为严重的内存安全问题。社区讨论提到 Debian 稳定版使用了较旧的 dnsmasq，而 OpenWRT 正在努力发布新版以修复这些漏洞。

hackernews · Lobsters · May 12, 18:12 · 社区讨论

背景: dnsmasq 是一个轻量级网络服务守护进程，提供 DNS 缓存、DHCP 服务器、TFTP 服务器和网络启动功能。它专为小型网络设计，常见于 Linux 发行版、嵌入式设备和安卓的 USB 共享网络中。C 程序中的内存安全错误是严重漏洞的常见来源，因为 C 不提供自动内存管理。

参考链接

社区讨论: 社区评论对基于 C 的软件中内存安全漏洞的普遍性表示担忧，有人主张用 Rust 或 Go 重写此类工具。也有人批评 Debian 的更新缓慢，而 OpenWRT 用户则在等待修复。还有用户推荐 MaraDNS，声称其漏洞较少。

标签: #security, #dnsmasq, #vulnerability, #memory-safety, #networking

谷歌推出新一代 TPU，专为 AI 智能体和模型训练设计 ⭐️ 9.0/10

谷歌宣布推出新一代张量处理单元（TPU），专为训练大规模 AI 模型和智能体而设计，标志着 AI/ML 硬件领域的重大进步。这款新 TPU 满足了高级 AI 智能体和前沿模型日益增长的计算需求，有望加速 AI 研究和部署，同时为云客户降低能耗和成本。第八代 TPU 据称突破了 AI 基础设施的“内存墙”，并包含专用于 AI 推理的版本，其前代 TPU v3 的性能为 420 teraflops，配备 128 GB 高带宽内存。

rss · InfoQ 中文站 · May 12, 14:23

背景: 张量处理单元（TPU）是谷歌定制设计的专用集成电路（ASIC），用于加速机器学习工作负载。谷歌自 2015 年以来一直在开发 TPU，每一代都带来了显著的性能提升；例如，TPU v3 Pods 可提供超过 100 petaflops 的性能。新一代 TPU 针对大语言模型和基于智能体的 AI 系统的独特需求而设计。

参考链接

标签: #TPU, #Google, #Hardware, #AI Training, #Machine Learning

SpaceX 发布星舰 V3，搭载 Raptor 3 引擎并增强热防护 ⭐️ 8.0/10

SpaceX 宣布推出星舰 V3，采用新型 Raptor 3 引擎和改进的热防护系统。Raptor 3 引擎在真空中提供 280 吨推力和 380 秒比冲，V3 设计将轨道续航能力延长至约 48 小时。此次升级标志着星舰在可重复使用和深空任务（包括载人登月与火星任务）方面迈出重要一步。增加的续航能力和引擎性能可能降低发射成本，并实现更长的轨道操作。 Raptor 3 采用全流量分级燃烧循环，使用甲烷/液氧推进剂，质量为 1525 千克。星舰 V3 还在尾翼和船体外壳上采用了不同尺寸的六边形隔热瓦进行结构加固。

hackernews · fprog · May 13, 01:29 · 社区讨论

背景: 星舰是 SpaceX 的超重型运载火箭，设计用于地球轨道、月球和火星任务。Raptor 引擎系列采用全流量分级燃烧循环，使用低温甲烷和液氧，提供高效率并可重复使用。星舰 V3 在先前版本基础上通过增强引擎和热防护来支持更长时间的任务。

参考链接

社区讨论: 社区情绪总体积极，用户赞扬 Raptor 3 引擎的简洁性和强大性能以及热防护改进。但也有部分人对马斯克关于太空 AI 在 2-3 年内成为最低成本计算的言论表示质疑，有评论称‘Elon 确实很理智。’

标签: #SpaceX, #Starship, #rocket-engineering, #aerospace, #Raptor-engine

Needle: 26M 参数的设备端工具调用模型 ⭐️ 8.0/10

Cactus 开源了 Needle，一个 26M 参数的工具调用模型，在消费级硬件上预填充速度达 6000 tok/s，解码速度达 1200 tok/s。它采用仅包含注意力和门控的新架构，无 MLP 层，并从 Gemini 蒸馏而来。这证明了工具调用可由极小型模型高效完成，从而在手机、手表和眼镜等设备上实现端侧智能体体验。它挑战了大型模型是函数调用必需的假设，有望降低成本和延迟。模型在 16 个 TPU v6e 上以 200B token 预训练 27 小时，随后用 2B token 的合成函数调用数据后训练 45 分钟。在单次函数调用上超越了 FunctionGemma-270M、Qwen-0.6B 和 Granite-350M。

hackernews · HenryNdubuaku · May 12, 18:03 · 社区讨论

背景: 工具调用（或称函数调用）是让 AI 模型通过 JSON 等结构化输出调用外部工具的能力。传统模型依赖大型前馈网络（FFN）存储事实知识，但 Needle 认为对于工具调用这类检索与组装任务，交叉注意力已经足够。知识蒸馏是一种让较小学生模型从较大教师模型中学习的技术。

参考链接

社区讨论: 评论者对在设备上运行微型模型表示兴奋，有人指出它在设置闹钟时超过了 Siri。其他人请求提供在线演示，并询问处理复杂工具区分的能力。有人建议重命名以避免参数单位’M’与’B’的混淆。

标签: #tool calling, #small language models, #open-source, #agents, #distillation

用散射模型渲染天空、日落和行星 ⭐️ 8.0/10

Maxime Heckel 的博客文章详细介绍了如何使用瑞利散射和米氏散射模型渲染逼真的天空、日落和行星，并提供了交互式 WebGL 演示。这项工作使网络开发人员和图形爱好者能够接触到高级大气渲染技术，将经典研究论文与现代实时图形连接起来。正如社区反馈所指出的，该演示使用了单次散射近似，可能无法准确模拟黄昏；它参考了 Nishita 等人于 1993 年发表的基础性论文。

hackernews · ibobev · May 12, 13:26 · 社区讨论

背景: 瑞利散射使天空呈现蓝色、日落呈现红色，而米氏散射处理云等较大粒子。该博客实现了这些物理模型，以实时生成逼真的大气效果。

参考链接

社区讨论: 社区评论赞扬了该教程，并链接了 Sebastian Lague 的相关工作，但也指出一个局限：由于黄昏现象，日落后天空不应立即变黑。其他人参考了经典的 Nishita 1993 论文，并分享了自己的项目。

标签: #computer graphics, #atmospheric scattering, #rendering, #real-time graphics

DuckDB 推出 Quack 协议实现远程访问与横向扩展 ⭐️ 8.0/10

DuckDB Labs 宣布推出 Quack，这是一个基于 HTTP 的客户端-服务器协议，为 DuckDB 带来了远程访问和横向扩展能力，据称在大批量分析中比 PostgreSQL 快 32 倍。该协议将 DuckDB 从纯嵌入式数据库转变为能够服务多个并发客户端并横向扩展的数据库，使其适用于更大的分析工作负载和团队用例。 Quack 是一个 MIT 许可的开源扩展，支持 DuckDB 在网络上充当服务器和客户端，并支持多个并发写入。它于 2026 年 5 月 12 日发布。

hackernews · aduffy · May 12, 17:54 · 社区讨论

背景: DuckDB 是一款嵌入式分析数据库，以其简单和快速著称，常被比作分析领域的 SQLite。在 Quack 之前，DuckDB 缺乏原生的客户端-服务器能力，限制了远程访问和横向扩展。

参考链接

社区讨论: 社区普遍持积极态度，用户对解决横向扩展和远程查询访问等实际问题表示兴奋。一位用户指出，DuckDB 作为“分析领域的 SQLite”的定位因 Quack 延伸到远程场景而更加清晰。也有用户对将来与其他系统（如 Postgres）的集成表示好奇。

标签: #DuckDB, #client-server, #database protocol, #analytics, #scalability

Obsidian 推出自动化插件审核系统 ⭐️ 8.0/10

Obsidian 推出了新的社区网站和自动化插件审核系统，用安全扫描和代码质量检查替代了之前基于 GitHub 的提交流程，适用于每个版本。这解决了关键的扩展瓶颈——此前提交新插件几乎不可能，导致开发者沮丧和团队过度劳累——从而加快提交速度并提高安全性。该系统已处理超过 2,300 个积压的插件提交，即将推出的功能包括基于能力的权限系统，以进一步沙盒化插件。

hackernews · xz18r · May 12, 15:45 · 社区讨论

背景: Obsidian 的插件生态系统迅速增长，但由七人小团队进行的手动审核变得不可持续，导致长时间延迟和开发者不满。新的自动化系统扫描每个插件版本的恶意软件和代码质量问题，并向用户显示安全评分卡。

参考链接

社区讨论: CEO kepano 表示兴奋并提到团队近一年的努力。开发者 dtkav 称赞缓解了瓶颈，而 varun_ch 和 troad 则对缺乏适当沙盒或权限系统的安全性表示担忧，认为仅靠自动化检查是不够的。

标签: #Obsidian, #plugins, #community, #automated review, #scaling

Bambu Lab 被指滥用开源社会契约 ⭐️ 8.0/10

Bambu Lab 以安全为名，对其 3D 打印机实施了限制性措施，如封锁局域网模式并要求云认证，社区认为此举违反了开源社会契约。这一事件凸显了 3D 打印社区中封闭生态系统与开源原则之间日益紧张的关系，可能侵蚀信任并限制用户对自己硬件的自由。据报道，Bambu Lab 根据用户代理字符串阻止未授权流量，批评者认为这不是有效的安全措施，而是控制生态系统的手段。该公司此前曾在社区反弹后撤销类似决定，重复了测试边界的行为模式。

hackernews · Lobsters · May 12, 14:54 · 社区讨论

背景: 开源社会契约指的是开源软件或硬件用户拥有修改、分享和控制其设备的自由。Bambu Lab 的打印机依赖专有软件和云服务，当其限制本地控制时，就与这些原则冲突。

社区讨论: 社区普遍持批评态度，评论指出 Bambu Lab 有在压力下才让步的历史。一些人提到替代方案需要更多技术知识，而另一些人质疑安全理由，认为用户代理屏蔽并非认证。少数评论提出了关于数据经过中国服务器的地缘政治担忧。

标签: #open-source, #3d-printing, #IoT, #ecosystem, #community-controversy

EFF 主张边境无证搜查电子设备违反第四修正案 ⭐️ 8.0/10

电子前沿基金会（EFF）向第四巡回上诉法院提交了一份摘要，主张在美国边境无证搜查电子设备违反第四修正案。此案可能为边境数字隐私权树立关键先例，因为 80%的美国人口居住在距边境 100 英里范围内，并受到扩大搜查权限的约束。该摘要特别质疑在机场无证检查被告人手机的行为，认为现代数字设备包含大量个人信息，不能像实体行李一样对待。

hackernews · hn_acker · May 12, 21:48 · 社区讨论

背景: 第四修正案保护公民免受不合理的搜查和扣押，但法院长期以来承认“边境搜查例外”，允许在边境对常规物品进行无证检查。然而，智能手机和笔记本电脑包含整个数字生活的兴起，引发了关于该例外是否适用于无需搜查令的电子设备的争议。

社区讨论: 评论者指出，尽管被告被判持有儿童性虐待材料（CSAM），但这并不削弱宪法问题，因为许多里程碑式案件涉及不令人同情的被告。另有人强调，政府针对被告的理由薄弱，仅基于对南美洲风险较高的模糊概念。

标签: #privacy, #border searches, #Fourth Amendment, #digital rights, #EFF

AI 编程代理必须按比例降低维护成本 ⭐️ 8.0/10

James Shore 认为，AI 编程代理必须将维护成本降低的幅度与其提高代码输出的幅度相同，否则由此产生的维护开销将变得不可持续。这挑战了常见的假设，即更快的代码生成总能提高生产力，并指出如果没有按比例降低维护成本，团队可能会面临永久性的维护负担，从而抵消短期收益。 Shore 的计算表明，在保持相同维护成本的同时将代码输出翻倍，实际上会使总维护成本翻倍；只有将单位代码的维护成本减半，才能平衡方程。

rss · Simon Willison · May 11, 19:48

背景: 在软件工程中，维护成本包括修复错误、更新依赖项和理解代码。AI 编程代理可以快速生成代码，但如果这些代码质量较低或难以维护，长期成本可能会超过最初的效率收益。Shore 的观点是呼吁 AI 工具同时帮助理解、测试和重构代码。

标签: #AI, #coding agents, #maintenance costs, #productivity, #software engineering

你的 AI 使用正在毁掉我的大脑：僵尸互联网 ⭐️ 8.0/10

Jason Koebler 的评论文章提出了‘僵尸互联网’这一术语，用来描述 AI 生成内容对人类写作和在线互动造成的令人疲惫且扭曲的影响。该文章强调了用户不断过滤 AI 垃圾内容所带来的日益增长的精神负担，并警告说人类写作风格正因接触 AI 生成文本而扭曲。这与人们对在线内容质量下降的广泛担忧产生了共鸣。 Koebler 将僵尸互联网与死亡互联网区分开来，强调复杂的机器人与人类互动，例如人们使用 AI 与人类交谈，以及 AI 代理与人类互动。他列举了 AI 生成的书摘要作为真书出售、自动化的 YouTube 频道等例子。

rss · Simon Willison · May 11, 19:21

背景: 死亡互联网理论是一种阴谋论，声称自 2016 年左右以来，大多数在线内容和互动都是自动化机器人。AI 热潮使这一理论更加可信，生成式 AI 淹没了网络。Koebler 的僵尸互联网将其重新定义为不仅仅是机器人与机器人对话，而是人类与 AI 互动的混乱混合，更难识别且精神负担更重。

参考链接

标签: #AI, #internet culture, #content moderation, #AI ethics, #Zombie Internet

Shopify 的 River 代理在 Slack 上公开编码 ⭐️ 8.0/10

Shopify 部署了 AI 编码代理 River，它只在公共 Slack 频道中运行，使每个对话都可搜索，任何员工都可以加入。过去 30 天内，5,938 名员工使用了 River，它参与了每八个合并拉取请求中的一个。 River 的公开设计方法营造了一种 ‘Lehrwerkstatt’（教学工坊）文化，通过渗透式学习促进组织学习。这种模式可能重塑 AI 工具在工作场所的整合方式，强调透明和协作而非个人生产力。 River 不回复私信，它要求使用公共频道以确保可见性。Shopify CEO Tobias Lütke 本人使用公共频道 (#tobi_river)，有超过 100 人关注、互动和学习。

rss · Simon Willison · May 11, 15:46

背景: AI 编码代理是帮助开发人员编写代码、运行测试和发起拉取请求的工具。传统的 AI 助手通常在私人工作空间中运行，限制了可见性。Shopify 的做法借鉴了德国 ‘Lehrwerkstatt’（教学工坊）的概念——通过观察工作来学习。

参考链接

标签: #coding agent, #AI-assisted development, #organizational learning, #transparency, #Slack

机器思维公司的 TML-Interaction-Small 276B-A12B 模型在实时语音领域刷新 SOTA ⭐️ 8.0/10

机器思维实验室发布了 TML-Interaction-Small 模型，这是一个拥有 276B 参数（12B 活跃参数）的混合专家模型，在实时语音交互中达到了最先进水平，并使传统的语音活动检测（VAD）变得过时。这一突破消除了实时语音系统中对 VAD 的需求，使得人机对话更加自然流畅，可能显著改善语音助手、客服机器人和无障碍工具等应用。该模型采用无编码器的早期融合架构，支持 200 毫秒微轮交互，从零开始联合训练音频、视频和文本模态，目前作为研究预览发布，预计未来几个月内有限度开放。

rss · Latent Space · May 12, 04:33

背景: 语音活动检测（VAD）是一种传统技术，用于检测人开始或停止说话，这对语音交互中的轮流说话至关重要。混合专家（MoE）模型通过每次输入仅激活部分参数来扩展参数规模同时保持推理成本可控。机器思维实验室的 TML-Interaction-Small 利用 MoE 实现了高质量的实时交互。

参考链接

标签: #AI, #voice interaction, #large language model, #SOTA, #Thinking Machines

参数高尔夫：AI 辅助研究竞赛的洞察 ⭐️ 8.0/10

OpenAI 的“参数高尔夫”竞赛汇聚了超过 1000 名参与者和 2000 份提交，在严格约束下探索 AI 辅助的机器学习研究、编码智能体、量化和新颖模型设计。这项竞赛展示了 AI 辅助研究如何在模型压缩和效率方面加速创新，可能降低边缘 AI 部署的门槛，并推动整个领域研究方法的进步。参与者的任务是在 16 MB 大小、训练时间不超过 10 分钟以及 100 万美元计算预算的约束下构建一个能干的语言模型，一个关键区别在于广泛使用了编码智能体。

rss · OpenAI Blog · May 12, 00:00

背景: “参数高尔夫”是 OpenAI 发起的一项开放研究竞赛，挑战参与者创建高度压缩的语言模型。量化降低模型精度，使模型运行更快、可在更便宜的硬件上运行。编码智能体是能够自主编写或调试代码的 AI 工具，许多参与者借助它们来满足严格的约束条件。

参考链接

标签: #AI-assisted research, #machine learning, #quantization, #model design, #coding agents

OpenAI 推出企业 AI 部署公司 DeployCo ⭐️ 8.0/10

OpenAI 成立了新公司 DeployCo，初始资金超过 40 亿美元，旨在帮助企业将前沿 AI 集成到生产工作流中。此举标志着 OpenAI 直接支持企业采用 AI 的重大举措，可能加速现实世界的影响，并创建 AI 部署服务的新模式。 DeployCo 将使用前向部署工程师和名为 Tomoro 的团队，将 AI 嵌入日常业务运营，专注于可衡量的业务成果。

rss · OpenAI Blog · May 11, 06:00

背景: 前沿 AI 指的是能够以接近人类的能力执行多样化复杂任务的高度先进 AI 模型。许多企业由于集成挑战和缺乏专业知识，难以从 AI 实验转向生产部署。DeployCo 旨在通过提供专门的咨询和工程支持来弥合这一差距。

参考链接

标签: #OpenAI, #enterprise AI, #AI deployment, #business impact

探讨将 dma-buf 用于用户空间读写操作 ⭐️ 8.0/10

在 2026 年的 Linux 存储、文件系统、内存管理和 BPF 峰会上，Pavel Begunkov 和 Kanchan Joshi 主持了一场联合会议，探讨如何提高 dma-buf 的效率并使其可用于用户空间的读写操作。这可能通过允许用户空间应用程序直接通过 dma-buf 执行 I/O 操作，从而显著提高存储和内存管理的性能，降低开销和延迟。该会议结合了存储和内存管理两个轨道，重点是将 dma-buf 的使用从设备间 I/O 扩展到用户空间发起的读写操作。技术细节包括优化缓冲区共享和同步。

rss · LWN.net · May 12, 17:25

背景: Linux 内核中的 dma-buf 子系统提供了一个框架，用于跨设备驱动程序和子系统共享内存缓冲区，主要用于高效的设备间 I/O。它在 DRM（直接渲染管理器）中被广泛用于图形缓冲区共享。Linux 存储、文件系统、内存管理和 BPF 峰会是一年一度的活动，内核开发者在会上讨论这些领域的改进。

参考链接

标签: #kernel, #dma-buf, #storage, #memory-management, #linux

将透明大页扩展到 1GB ⭐️ 8.0/10

Usama Arif 在 2026 年 Linux 存储、文件系统、内存管理和 BPF 峰会上主持了一场会议，讨论如何让透明大页（THP）在 x86 系统上支持 1GB 页面，突破当前 2MB 的最大限制。如果成功，这将使需要极大连续内存的工作负载能够使用透明大页，改善 TLB 覆盖并减少数据库、科学计算和大内存应用的页表开销。目前，THP 仅支持 PMD 级别的巨页（x86 上为 2MB）。扩展到 PUD 级别（1GB）在分配、碎片化和升降级逻辑方面面临挑战。

rss · LWN.net · May 12, 13:24

背景: 巨页是大于标准 4KB 的内存页，用于减少转换后备缓冲器（TLB）缺失和页表开销。在 x86 上有两种常见的巨页大小：2MB（PMD 级别）和 1GB（PUD 级别）。透明大页（THP）自动管理巨页而无需修改应用程序，但目前仅支持到 2MB。将 THP 扩展到 1GB 可使虚拟机、大型数据库等工作负载受益。

参考链接

标签: #Linux kernel, #memory management, #huge pages, #performance, #systems research

两个稳定内核发布，修复 Dirty Frag 漏洞 ⭐️ 8.0/10

Greg Kroah-Hartman 发布了 7.0.6 和 6.18.29 稳定内核，其中包含对 CVE-2026-43500 的补丁，这是 Dirty Frag 本地权限提升漏洞利用链中的漏洞之一。此修复解决了一个严重的安全问题，它允许非特权用户在 Linux 系统上获得 root 访问权限，并且已有报告称该漏洞已在野外被积极利用，因此所有用户都应立即升级。该补丁应用于两个稳定内核分支 7.0.6 和 6.18.29，建议用户立即升级。该漏洞是攻击链的一部分，该链条还涉及 CVE-2026-43284 和 Copy Fail 2 漏洞利用。

rss · LWN.net · May 11, 13:35

背景: Dirty Frag 是 Linux 内核中最近披露的一个本地权限提升 (LPE) 漏洞，它利用两个漏洞（CVE-2026-43284 和 CVE-2026-43500）让非特权用户提升至 root 权限。它影响内核网络和内存碎片处理组件。另外，Copy Fail（CVE-2026-31431）是另一个利用页缓存写入绕过的 LPE 漏洞。新发布的补丁专门针对 CVE-2026-43500。

参考链接

标签: #Linux kernel, #security, #vulnerability, #CVE-2026-43500, #stable release

Debian 强制要求可重现构建以进入测试 ⭐️ 8.0/10

Debian 发布团队已启用其迁移软件（britney）来阻止不可重现构建的软件包进入测试套件，该政策自 2024 年 5 月 9 日起生效。这一政策通过确保二进制文件能够独立验证与源代码匹配，极大地增强了软件供应链安全性，为其他发行版树立了重要先例。可重现要求严格适用于 Debian 的构建环境，而已在测试套件中且可重现性退化的软件包同样会被阻止更新。

rss · LWN.net · May 11, 13:21

背景: 可重现构建确保编译相同源代码始终产生相同的二进制文件，有助于检测篡改和后门。Debian 的测试套件是下一个稳定版的暂存区，而 britney 软件管理软件包从不稳定版到测试版的迁移。

参考链接

社区讨论: 社区成员 Gioele Barabucci 指出，此处的“可重现”仅限于 Debian 的构建环境，这一要求比通常更为严格，但仍被视为向前迈出的一大步。

标签: #Debian, #reproducible builds, #software supply chain security, #open source

OpenViking 让 AI 智能体学会记仇和伪装意图 ⭐️ 8.0/10

字节跳动开源了 OpenViking，一个专为 AI 智能体设计的上下文数据库，在多智能体演示中，它使智能体能够表现出记仇和伪装意图等复杂社交行为。这标志着多智能体交互研究的重要一步，表明 AI 智能体可以学习比简单合作或竞争更细微的社交策略，可能带来更逼真的模拟和更先进的 AI 系统。 OpenViking 是一个开源上下文数据库，通过文件系统范式统一管理记忆、资源、技能和工具，专为 AI 智能体（如 OpenClaw）设计。

rss · InfoQ 中文站 · May 13, 10:50

背景: 多智能体系统涉及多个 AI 智能体在共享环境中交互。智能体中的欺骗或记仇等社交行为需要复杂的记忆和上下文管理。OpenViking 提供了一种极简的上下文交互范式来简化这种管理。

参考链接

OpenViking: The Context Database for AI Agents - GitHub

标签: #multi-agent systems, #AI agents, #open-source, #social behavior, #ByteDance

OpenAI WebSocket 模式将代理延迟降低 40% ⭐️ 8.0/10

OpenAI 于 2026 年 4 月 22 日为其 Responses API 推出了基于 WebSocket 的执行模式，通过用持久连接替代 HTTP 请求-响应循环，将代理工作流中的延迟降低高达 40%。这一更新显著提高了需要多步骤交互的编程代理和实时 AI 系统的性能，使 AI 代理在生产环境中响应更迅速、效率更高。 WebSocket 模式支持零数据保留（ZDR）和 store=false 设置，并使用到/v1/responses 的持久连接，每次交互仅发送新输入项和之前的 response_id。

rss · InfoQ 中文站 · May 13, 10:34

背景: 代理工作流是指不仅能生成输出，还能在多个步骤中做出决策并控制流程的 AI 系统。传统的 HTTP 请求-响应循环会引入网络往返延迟，从而拖慢这些多轮交互。WebSocket 提供持久化的双向通道，消除了重复握手和头部的开销。

参考链接

标签: #OpenAI, #WebSocket, #agent workflow, #latency reduction, #AI infrastructure

知名开源作者呼吁验证软件供应链 ⭐️ 8.0/10

一位知名开源作者公开呼吁社区从盲目信任依赖项转向主动验证软件供应链的完整性。这一呼吁凸显了现代软件开发中的关键漏洞，诸如依赖混淆等供应链攻击日益普遍，可能推动验证实践的广泛采纳。该作者的呼吁与 SLSA（软件制品供应链级别）和 OWASP 软件组件验证标准等框架一致，这些框架为供应链安全提供了结构化方法。

rss · InfoQ 中文站 · May 12, 19:13

背景: 在高调的 SUNBURST 事件等攻击之后，软件供应链安全已成为首要关注点。依赖混淆攻击等方法允许通过包管理器注入恶意代码。SLSA 等验证标准定义了保证级别，帮助组织确保其软件依赖项的完整性。

参考链接

标签: #software supply chain, #security, #open source, #verification, #trust

谷歌在 Next 26 大会宣布推出 GKE Agent Sandbox 和 Hypercluster ⭐️ 8.0/10

谷歌云在 Cloud Next ‘26 上宣布推出 GKE Agent Sandbox 和 Hypercluster，将 Kubernetes 重新定位为 AI 代理编排平台。Agent Sandbox 利用 gVisor 内核隔离，实现对 AI 生成代码的大规模安全短暂执行。这标志着云原生 AI 基础设施的重大转变，使开发者能够在 Kubernetes 集群中安全运行不受信任的 AI 代理。此举将 GKE 定位为 AI 代理开发和部署的核心平台，有望加速企业 AI 的采用。 Agent Sandbox 提供每秒高达 300 个沙箱的 AI 代码执行隔离，并作为开源组件构建。Hypercluster 是一项新功能，用于跨多个集群管理大规模 AI 工作负载，但细节尚不明确。

rss · InfoQ 中文站 · May 12, 17:02

背景: Kubernetes 是一个开源容器编排平台，广泛用于部署和管理应用程序。Google Kubernetes Engine (GKE) 是谷歌云的托管 Kubernetes 服务。AI 代理是能够利用大语言模型或其他 AI 模型执行任务的自主程序。Agent Sandbox 在 GKE 中提供安全的运行时环境，用于执行可能不受信任的 AI 生成代码，解决了 AI 代理工作流中的安全问题。

参考链接

标签: #Kubernetes, #Google, #AI, #GKE, #cloud computing

从 Redis 到 Valkey：开源社区的快速创新 ⭐️ 8.0/10

在 Redis 更改许可证为限制性模式后，开源社区将其分支为新的内存数据库 Valkey。Valkey 现在由 Linux 基金会托管，并作为社区驱动的项目继续发展。这一转变凸显了开源社区的韧性，确保关键基础设施组件保持自由和开放。它为社区如何应对流行项目的许可证变更树立了先例。 Valkey 是一个高性能键值数据存储，支持缓存、消息队列和作为主数据库运行。它采用 BSD 许可证，通过将所有数据保存在内存中来提供低延迟操作。

rss · InfoQ 中文站 · May 12, 15:38

背景: Redis 是一个流行的开源内存数据库，但在 2024 年，其创建者 Redis Labs 将许可证从 BSD 更改为更具限制性的服务器端公共许可证（SSPL）。这促使社区分支该项目，在 Linux 基金会下创建了 Valkey，以保留开源替代方案。

参考链接

标签: #Redis, #Valkey, #open source, #database, #innovation

攻击者在 Flippa 购买 30 个 WordPress 插件植入后门 ⭐️ 8.0/10

攻击者通过 Flippa 购买了 Essential Plugin 组合中的 30 个 WordPress 插件，并秘密植入后门，导致数千个网站被入侵。此次供应链攻击揭示了 WordPress 生态系统中存在重大安全隐患，受信任的插件可能被用来向大量网站分发恶意软件。被植入后门的插件在八个月内未被发现，整个 Essential Plugin 组合被下架以消除威胁。

rss · InfoQ 中文站 · May 12, 10:07

背景: WordPress 插件扩展了网站功能，但通常由第三方开发并通过 Flippa 等市场出售。攻击者可以通过这些市场购买现有插件，然后注入恶意代码，影响所有使用这些插件的用户。

参考链接

社区讨论: 此新闻项未提供社区讨论内容。

标签: #cybersecurity, #WordPress, #supply chain attack, #plugin security, #backdoor

Redis 与野心的代价 ⭐️ 8.0/10

文章批判性地审视了 Redis 最近的战略转变，包括从 BSD 许可证变更为源代码可用许可证的争议性决定，以及由此导致的社区分裂和 Valkey 分支的创建。这一分析凸显了项目商业雄心与开源社区之间的紧张关系，这是 MongoDB 和 Elasticsearch 等数据库生态系统中反复出现的主题，并强调了疏远贡献者和用户的长期风险。该博客出自受尊敬作者（coleifer）之手，在 Lobste.rs 上获得 8.0/10 高分，表明反响强烈。Redis 7.4 的许可证变更引入了 RSALv2 和 SSPLv1 双重许可，促使 AWS 和 GCP 分叉出 Valkey。

rss · Lobsters · May 12, 17:01

背景: Redis 是一种流行的内存键值数据库。历史上基于宽松的 BSD 许可证发布，但 Redis 公司于 2024 年 3 月将许可变更为源代码可用模型，以限制 AWS 等云服务提供商在未经回馈的情况下提供 Redis 即服务。此举导致由主要云厂商支持的开源分支 Valkey 的诞生。

参考链接

社区讨论: 根据 Lobste.rs 的评论链接，社区可能会就 Redis 所做的取舍展开辩论，一些人支持公司盈利的权利，另一些人则批评其对开源原则的背叛。高分表明该分析受到广泛认可。

标签: #Redis, #Database, #Software Engineering, #Commentary

Go 库 fsnotify 因维护者权限变更引发供应链警报 ⭐️ 8.0/10

流行的 Go 库 fsnotify 的维护者权限突然变更，引发了关于潜在供应链风险的担忧。由于 fsnotify 被广泛应用于 Go 项目的文件系统通知，任何安全漏洞都可能影响数千个下游应用，凸显了开源供应链的脆弱性。该事件涉及仓库控制权的变更，缺乏明确的社区共识，引发了恶意代码注入的担忧。目前尚未确认存在恶意代码。

rss · Lobsters · May 12, 03:49

背景: fsnotify 是一个 Go 库，为 Windows、Linux、macOS、BSD 和 illumos 提供跨平台文件系统通知。它是许多基于 Go 的工具和服务的关键依赖，因此其安全状态对整个生态系统至关重要。

参考链接

标签: #Go, #supply chain security, #open source, #library, #maintainer dispute

Android 16 VPN 泄露漏洞未获谷歌修复 ⭐️ 8.0/10

Mullvad 披露，最近 Android 版本上的任意应用都可能泄露特定流量，特别是利用 QUIC 优化漏洞绕过 VPN 保护。此漏洞破坏了 Android 上的 VPN 隐私保障，影响数百万依赖 VPN 确保安全的用户。谷歌决定不修复此问题，使得用户除非使用像 GrapheneOS 这样的替代系统，否则仍面临风险。该漏洞存在于 Android 的 QUIC 网络优化中，允许应用在 VPN 隧道外发送流量。GrapheneOS 已在最新更新中禁用了此优化，但谷歌拒绝提供修复。

rss · Lobsters · May 12, 12:04

背景: 现代 Android 版本包含一项 QUIC 优化，可能绕过 VPN，导致应用泄露流量。VPN 通过加密隧道路由所有设备流量以保护隐私，但此漏洞允许某些应用流量逃逸。谷歌 Android 安全团队决定不修复，称其严重性较低，但隐私倡导者不认同。

参考链接

标签: #Android, #security, #privacy, #traffic leak, #VPN

Trail of Bits 分叉 Go 工具链以增强模糊测试能力 ⭐️ 8.0/10

Trail of Bits 分叉了官方的 Go 工具链，集成了之前缺失的先进模糊测试功能，填补了 Go 原生模糊测试支持的空白。这一分叉大大改进了 Go 开发者的安全测试工具箱，使得更彻底、更高效地发现 Go 程序中的漏洞成为可能。该分叉名为 gosentry，在 Go 现有模糊测试支持的基础上增加了覆盖率引导的插桩和改进的崩溃检测，全部集成在标准工具链中。

rss · Lobsters · May 12, 11:27

背景: 模糊测试（Fuzz testing）是一种自动化软件测试技术，通过向程序输入随机或意外数据来发现错误和漏洞。Go 编程语言在 Go 1.18 中引入了原生模糊测试支持，但缺少其他模糊测试工具中的一些高级功能。Go 工具链包括编译器、汇编器、标准库以及构建 Go 程序所需的其他工具。

参考链接

标签: #Go, #fuzzing, #toolchain, #security

Mythos AI 发现 curl 漏洞，但炒作受质疑 ⭐️ 8.0/10

curl 的创建者 Daniel Stenberg 测试了 Anthropic 的 Mythos AI 模型，在 curl 代码库中发现了一个漏洞，但他认为该模型的性能并不显著优于现有的 AI 工具。 curl 是数十亿人使用的基础工具，任何漏洞都至关重要。这也凸显了关于先进 AI 模型在网络安全中实际能力的持续争论。 Mythos 在 curl 中发现了一个漏洞，但 Daniel 指出其他 AI 模型过去也曾发现过类似问题。他强调 AI 驱动的代码分析器总体上优于传统分析器，但 Mythos 并未展现出显著改进。

rss · Lobsters · May 11, 07:24

背景: curl 是一个用于 URL 数据传输的命令行工具和库，被无数系统使用。由于 curl 的广泛使用，发现其漏洞影响重大。Mythos 是 Anthropic 开发的 AI 模型，据报道能够发现零日漏洞，引发对其潜在滥用的担忧。curl 的创建者 Daniel Stenberg 测试了 Mythos 以评估其有效性。

参考链接

标签: #security, #curl, #vulnerability

Ratty：支持内联 3D 图形的 GPU 渲染终端模拟器 ⭐️ 8.0/10

Ratty 是一款新发布的终端模拟器，它利用 GPU 渲染图形，并支持内联 3D 对象，使得 3D 模型可以直接与文本一同在终端中显示。这一创新弥合了传统命令行界面与现代图形应用之间的差距，可能改变开发者在开发工具中可视化数据和与 3D 内容交互的方式。 Ratty 使用自有的 Ratty Graphics Protocol (RGP) 在终端单元格中放置内联 3D 对象，支持 .obj 和 .glb 文件格式，并使用 Rust 和 Ratatui 框架构建。

rss · Lobsters · May 11, 10:10

背景: 终端模拟器是一种在图形界面内模拟文本计算机终端的程序。传统上，终端仅限于文本和简单的 ASCII 艺术。在终端中实现内联 3D 图形是一个不寻常的概念，灵感来自 TempleOS，一个将 3D 图形集成到命令行中的操作系统。Ratty 利用 GPU 加速，将 3D 对象无缝渲染到终端文本旁边。

参考链接

标签: #terminal emulator, #3D graphics, #open source, #innovation, #developer tools

在 AI 时代重新审视“没有银弹” ⭐️ 8.0/10

一篇通讯文章重新审视了弗雷德·布鲁克斯 1986 年的《没有银弹》论文，探讨 AI 是否可能成为软件工程中难以捉摸的银弹。这一思考意义重大，因为它挑战了关于软件生产力的长期信念，并评估了 AI 彻底改变软件工程的潜力，将对开发者和行业产生影响。该文章基于布鲁克斯的论点，即没有单一技术能带来显著的生产力提升，并探讨现代 AI 工具是否能最终打破这一假设。

rss · The Pragmatic Engineer · May 12, 17:10

背景: 弗雷德·布鲁克斯在 1986 年的论文《没有银弹》中提出，没有单一技术能在十年内使软件生产力提高十倍。这一观点在软件工程中影响深远，塑造了对工具和方法的期望。本文在大型语言模型等最新 AI 进展的背景下重新审视了这一论点。

标签: #software engineering, #AI, #no silver bullet, #Fred Brooks, #software development

GitHub 克隆项目旨在恢复 Bambu Lab 打印机网络支持 ⭐️ 7.0/10

GitHub 仓库克隆项目 FULU-Foundation/OrcaSlicer-bambulab 被创建，旨在恢复 Bambu Lab 打印机的完整 BambuNetwork 支持，此前一次有争议的固件更新引入了强制云认证。此举直接挑战了 Bambu Lab 类似 DRM 的限制，回应了社区对 3D 打印生态系统中硬件锁定和用户自由的日益担忧。该克隆基于 OrcaSlicer 仓库在 Bambu Lab 固件更新之前的状态，该更新将打印机访问分为云模式和 LAN 模式，后者仍需部分认证。

hackernews · Murfalo · May 12, 21:55 · 社区讨论

背景: Bambu Lab 在 2025 年 1 月为 X1 系列打印机发布的固件更新增加了对某些操作（包括网络打印）的强制认证，引发了 3D 打印社区的强烈反对。批评者认为这限制了用户控制权，并威胁到 RepRap 运动的开源精神。OrcaSlicer 是一个流行的开源切片软件，被许多 Bambu Lab 用户使用。

参考链接

社区讨论: 评论者如 bri3d 解释该克隆复制了更新前的状态，而 ghostpepper 强调了 Bambu 最初计划甚至对 LAN 模式也要求云认证。有人对数据收集和订阅模式表示担忧，asveikau 则批评了被压扁的 git 历史。

标签: #3D printing, #open source, #firmware, #DRM, #Bambu Lab

资深开发者为何难以传达专业经验 ⭐️ 7.0/10

Nair.sh 上的一篇详细分析探讨了资深开发者为何难以传达自己的专业知识，指出内部世界模型和上下文依赖性是最主要的障碍。这一问题影响着软件工程中的团队效率与知识传承，而高效的专业交流对于指导新人和项目成功至关重要。文章指出，专业知识往往存在于难以言说的心智模型中，而与上下文相关的知识又进一步增加了沟通的复杂性。

hackernews · nilirl · May 12, 15:08 · 社区讨论

背景: 专业知识的交流是技术领域的常见难题。资深开发者通过经验积累了大量隐性知识，这些知识难以用语言表达。这可能导致误解或不愿分享，从而影响团队协作。

社区讨论: 社区评论呈现出多元观点：有人指出内心模型与言语表达之间存在差距，也有人注意到初级开发者对指导往往兴趣不大。此外，还有关于软件开发中冒险与责任归属的讨论。

标签: #software-engineering, #career-development, #communication, #senior-developer

Datasette 1.0a29 发布，修复段错误并改进 UI ⭐️ 7.0/10

Datasette 1.0a29 已发布，新增 TokenRestrictions.abbreviated 实用方法，修复了连接关闭时因竞态条件导致的段错误，并改进了空表时表头的可见性。此版本修复了一个可能导致测试崩溃的严重段错误，提升了开发者的稳定性。UI 修复改善了可用性，尤其在移动设备上，使 Datasette 在探索和发布数据时更可靠。段错误由两个 Datasette.close() 调用之间的竞态条件引起；Simon Willison 使用 Codex CLI 和 GPT-5.5 创建了重现该错误的最小 Dockerfile。新方法 TokenRestrictions.abbreviated 用于创建 token 限制的 ‘_r’ 字典。

rss · Simon Willison · May 12, 23:41

背景: Datasette 是一个用于探索和发布数据的开源工具，可将数据集转化为交互式网站和 API。1.0a 系列是通往稳定版 1.0 的 alpha 版本。竞态条件是指多个线程在缺乏同步的情况下访问共享资源，导致段错误等不可预测行为。

参考链接

标签: #datasette, #release, #python, #database, #bug-fix

Hashimoto：技术决策者跟风是为了不被解雇 ⭐️ 7.0/10

Mitchell Hashimoto 在 Lobste.rs 上关于 Redis 首页的评论中指出，90% 的技术决策者主要为了避免个人风险而遵循分析机构（如 Gartner 和 McKinsey）支持的世俗趋势。这一见解揭示了企业技术采购决策背后的关键驱动因素——往往与技术本身无关，解释了为什么’AI 战略’和’上下文引擎’等流行词主导采购。 Hashimoto 将这些技术决策者与周末浏览 Lobste.rs 或为开源做贡献的爱好者进行对比，暗示了文化和动机上的差异。他的评论是关于 Redis 首页设计讨论的一部分。

rss · Simon Willison · May 12, 22:21

背景: Mitchell Hashimoto 是 Vagrant、Packer、Terraform 等广泛使用的 DevOps 工具的共同创建者。技术决策者（TDM）是负责在企业内选择和技术采购的人员。他的观察反映了对企业 IT 的常见批评：决策更多出于害怕承担责任而非真正的创新。

标签: #decision-making, #enterprise, #technical opinion, #commentary

LLM 0.32a2 增加 OpenAI 推理端点支持 ⭐️ 7.0/10

LLM 0.32a2 alpha 将支持推理的 OpenAI 模型从 /v1/chat/completions 端点切换至 /v1/responses 端点，实现了 GPT-5 类模型跨工具调用的推理交织。它现在以不同颜色在标准错误输出上显示推理令牌摘要，并提供 -R/–hide-reasoning 标志来隐藏它们。此次更新使 OpenAI 最新的推理模型在命令行中更加透明和易用，有利于需要检查模型推理过程的开发者。它标志着 OpenAI 专为高级代理工作流设计的新 Responses API 的实际应用。该变更在拉取请求 #1435 中实现，适用于大多数支持推理的 OpenAI 模型。用户也可以设置隐藏推理标志来避免看到推理令牌。

rss · Simon Willison · May 12, 17:45

背景: LLM 是 Simon Willison 开发的流行命令行工具，用于在终端中与大型语言模型交互。OpenAI 的 /v1/responses 端点是一种较新的 API，它扩展了聊天补全功能，支持结构化输出和思维链推理等更丰富的能力，对于代理工作流非常重要。推理令牌是模型在思维链处理过程中生成的中间令牌，提供了对模型内部思考过程的洞察。

参考链接

标签: #llm, #openai, #ai, #tool release, #reasoning

GitLab 为‘代理时代’重组并裁员 ⭐️ 7.0/10

GitLab 宣布裁员 7%并进行重大重组，以迎接“代理时代”，包括减少最多 30%的业务国家、扁平化管理层级，并将研发部门重组为 60 个自主团队。这家主流 DevOps 公司的重大重组表明，整个行业正转向 AI 驱动的开发和更精简、更有自主权的团队模式，可能对软件开发方式产生深远影响。重组包括废除 CREDIT 价值观框架，代之以“速度与质量、主人翁心态、客户成果”，但多样性仍体现在“人际卓越”子项中。GitLab 计划用 AI 代理自动处理内部流程。

rss · Simon Willison · May 11, 23:58

背景: GitLab 是一家以全远程团队闻名的 DevOps 平台，业务遍及近 60 个国家。“代理时代”指的是 AI 代理和自动化增加软件需求同时降低生产成本的行业趋势。

参考链接

标签: #GitLab, #workforce reduction, #remote work, #tech industry, #strategic planning

在脚本 shebang 行中使用 LLM ⭐️ 7.0/10

Simon Willison 的 TIL 展示了如何在他的 LLM 命令行工具的 shebang 行中使用它，从而通过提示词、片段和工具调用直接从可执行文本文件生成内容。这一技术模糊了脚本与 AI 生成内容之间的界限，使开发者能够创建自我文档化、由 AI 驱动的脚本，无需大量模板代码即可执行计算或数据库查询等复杂任务。示例包括使用 -f 标志处理片段，-T 标志调用 llm_time 等工具，以及使用包含内联 Python 函数定义的 YAML 模板。--td 标志可启用工具调试输出。

rss · Simon Willison · May 11, 18:48

背景: Shebang 行（例如 #!/usr/bin/env python）告诉类 Unix 系统使用哪个解释器来执行脚本。Simon Willison 的 LLM 是一个用于与大型语言模型交互的命令行工具，支持片段（可重复使用的提示词部分）和工具调用（调用外部函数）等功能。通过在脚本开头放置 LLM shebang，纯文本文件变为可执行文件，将其内容作为提示词发送给 LLM。

参考链接

社区讨论: 在 Hacker News 上，用户 Kim_Bruning 评论说，现在可以在英文文本文件上放置 shebang 行，‘如果你足够勇敢’，这捕捉到了这种方法的巧妙但又略带危险的性质。社区普遍认为它有趣且富有创意。

标签: #LLM, #shebang, #command-line, #scripting

质疑 AI 微调的未来 ⭐️ 7.0/10

来自 Latent Space 的一篇反思性文章提出了一个挑衅性问题：微调（AI 模型定制中的主导技术）是否正走向过时。该文鼓励社区重新思考微调在提示工程和基础模型改进等替代方法背景下的作用。微调是将大型语言模型适配到特定任务的基石实践，质疑其持久性对研究人员、开发者和投资 AI 的企业都有重大影响。这一讨论可能加速替代范式的采用，并重塑模型在生产中的部署方式。该文章并未宣布具体的突破或变化，而是邀请读者对 AI 定制化的方向进行反思。它刊登于以深思熟虑的分析而闻名的 Latent Space 通讯中，可能反映了业界关于微调效率与其他技术对比的更广泛讨论。

rss · Latent Space · May 13, 02:47

背景: 微调是指将预训练模型在较小的、任务特定的数据集上进一步训练以提高性能。它被广泛用于自然语言处理和计算机视觉，但近来提示工程、少样本学习和更大基础模型的进展对其必要性提出了挑战。文章标题“微调之终结”利用了这些替代方法可能减少对微调依赖的观点。

标签: #finetuning, #AI, #LLM, #machine learning

中国开放 AI 生态的复合优势 ⭐️ 7.0/10

该文章反思了中国的高参与度、开放优先的人工智能生态系统如何比封闭模型积累更多优势，揭示了开放模型生态系统的动态。这一分析具有重要意义，因为它指出了开放生态可能超越封闭生态的战略分歧，影响全球 AI 发展与竞争。文章聚焦中国的生态系统，强调高参与度和开放性作为随时间积累的关键因素，带来更大的集体创新。

rss · Interconnects · May 12, 15:54

背景: 开放模型生态系统，例如由开源 AI 模型驱动的生态系统，允许自由访问、修改和分发 AI 技术。这与像 OpenAI 这样的公司开发的专有封闭模型形成对比。中国营造了一个研究人员参与度高、开放共享的环境，可能加速进步。

标签: #AI, #open models, #China, #ecosystems

使用 4KB 内核实现 64KB 页面的两种方法 ⭐️ 7.0/10

在 2026 年 Linux 存储、文件系统、内存管理和 BPF 峰会上，两个环节探讨了允许进程使用 64KB 页面大小而内核继续使用 4KB 页面的选项。这可以在不需要全局更改页面大小的情况下，让受益于更大页面的应用获得性能提升，尤其适用于 x86 等本身不支持 64KB 页面的架构。第一种方法侧重于每个进程的页面大小，允许每个进程独立于内核选择自己的页面大小。第二种方法旨在将 64KB 页面支持引入 x86 系统，而 x86 传统上使用 4KB 页面。

rss · LWN.net · May 11, 13:35

背景: 在内存管理中，页面大小是内核管理的最小内存单位。更大的页面可以通过减少 TLB 未命中来提高性能，但可能浪费内存。一些架构如 ARM64 支持多种页面大小，而 x86 通常使用 4KB 基础页面。

参考链接

标签: #Linux, #kernel, #memory management, #page sizes

Cortex 智能代理赋能 Snowflake Intelligence 构建企业 AI 平台 ⭐️ 7.0/10

Snowflake 推出了 Cortex Agents，这是一个 AI 代理编排平台，与 Snowflake Intelligence（一个面向业务用户的独立代理应用）集成。Cortex Agents 可以规划任务，使用 Cortex Analyst 和 Cortex Search 等工具，并借助 LLM 生成响应。这一发展代表了企业 AI 的重要一步，使组织能够在其数据平台内直接构建和部署可信的 AI 代理。它降低了业务用户从结构化和非结构化数据中获取洞察的门槛，同时保持了安全性和治理。 Cortex Agents 通过使用 Cortex Analyst 和 Cortex Search 作为工具，结合 LLM，编排结构化和非结构化数据。Snowflake Intelligence 提供了一个即用的对话式界面，帮助业务用户无需技术专长即可发现深度洞察。

rss · InfoQ 中文站 · May 13, 10:57

背景: Snowflake Cortex AI 是一套生成式 AI 服务，在 Snowflake 的安全边界内运行，提供内置策略和访问控制。Cortex Agents 是一个新的编排层，结合了 Cortex Analyst（用于结构化数据）和 Cortex Search（用于非结构化数据）来创建智能代理。Snowflake Intelligence 是构建在 Cortex Agents 之上的独立代理应用，为业务用户提供直观的界面来查询和分析数据。

参考链接

标签: #Snowflake, #AI agents, #enterprise AI, #data platform

实时交互 AI 模型挑战 ChatGPT 回合制 ⭐️ 7.0/10

由前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab 开发的新 AI 模型展示了原生实时交互能力，通过每 200 毫秒处理一段音视频输入并持续交错输出，无需等待用户说完。这一突破可能从根本上改变人机交互方式，从回合制转向实时协作，使对话更自然、响应更及时，有望超越当前 ChatGPT 的范式。该模型采用双层架构：交互模型负责实时处理，背景模型负责深度推理，在即时性和智能性之间取得平衡。

rss · InfoQ 中文站 · May 13, 10:17

背景: 传统 AI 聊天模型（如 ChatGPT）采用回合制：用户说完、模型处理、然后回复——存在明显延迟。实时交互模型则持续处理输入流，允许自然打断并同时响应，类似于人类对话。

参考链接

标签: #AI, #real-time interaction, #ChatGPT, #language models, #research

火山引擎 OpenViking：面向 AI Agent 的上下文数据库 ⭐️ 7.0/10

在 AICon 上海大会上，火山引擎发布了 OpenViking，这是一个专为 AI Agent 设计的开源上下文数据库，采用文件系统范式来统一管理记忆、资源和技能。 OpenViking 解决了 AI Agent 开发中的关键挑战——上下文管理，通过提供标准化范式简化开发，实现分层上下文的传递和自主进化，可能加速更智能、更自主的 Agent 的创建。该数据库采用极简的上下文交互范式，允许开发者通过类似文件系统的界面管理上下文，具有分层上下文传递和自主进化等特性。

rss · InfoQ 中文站 · May 13, 10:00

背景: 在 AI Agent 系统中，上下文指代 Agent 可积累的记忆、可用资源、技能和工具。传统数据库并未针对这种动态分层数据进行优化。OpenViking 重新思考了专为 Agent 设计的数据库，利用文件系统隐喻使上下文管理直观且可扩展。

参考链接

标签: #database, #context, #paradigm, #AI, #conference

平台工程三大支柱的良性循环 ⭐️ 7.0/10

文章阐述自动化可靠性、开发者体验和治理三大支柱如何在平台工程中形成相互强化的良性循环。理解这一循环有助于组织设计既能提升开发者生产力又能增强系统可靠性的内部开发者平台，这是现代 DevOps 中的关键挑战。三大支柱分别是自动化可靠性（如自愈基础设施）、开发者体验（如简化界面）和治理（如策略即代码）。它们形成一个反馈循环，一个领域的改进会惠及其他领域。

rss · InfoQ 中文站 · May 13, 09:33

背景: 平台工程是一门专注于构建内部开发者平台（IDP）的学科，提供自助工具和工作流。三大支柱概念是一个平衡可靠性、易用性和合规性的框架。本文基于 InfoQ 的演讲，阐述了这些支柱如何协同工作以避免取舍。

参考链接

Three Pillars of Platform Engineering: a Virtuous Cycle - InfoQ

标签: #platform engineering, #devops, #software engineering, #infrastructure, #internal developer platform

Kubernetes 上 AI 智能体安全：信任、密钥与可观测性 ⭐️ 7.0/10

一篇 InfoQ 文章探讨了 Kubernetes 中自主 AI 智能体的安全挑战，提出了基于 Job 的隔离、Vault 作用域短期凭证、四阶段信任模型和定制可观测性等模式。自主 AI 智能体打破了 Kubernetes 传统安全假设，具有动态依赖和多域凭证；这些模式对于在生产环境中安全部署 AI 智能体至关重要。四阶段信任模型从影子模式演进到完全自主，可观测性针对非确定性推理周期进行了调整。密钥管理使用 Vault 来发放短期、作用域限定的密钥。

rss · InfoQ 中文站 · May 12, 12:12

背景: 自主 AI 智能体能够通过生成代码并与运行时环境交互来进行推理、规划和执行操作，引入了新型云工作负载。Kubernetes 的安全模型并非为这种动态、多域智能体设计，因此需要新的信任、凭证管理和监控方法。

参考链接

标签: #Kubernetes, #AI Security, #Cloud Security, #Key Management, #Observability

Claude Code 忽略 CLAUDE.md 导致额度浪费 ⭐️ 7.0/10

据报道，Anthropic 的 AI 编程助手 Claude Code 会忽略 CLAUDE.md 配置文件，导致过度且非预期的 API 使用，迅速耗尽用户额度。这损害了用户信任以及 CLAUDE.md 作为持久配置机制的价值，可能导致开发者遭受重大经济损失，并对 Anthropic 的 harness 工程方法的有效性提出质疑。据报告，该漏洞导致 Claude Code 忽视 CLAUDE.md 中定义的项目特定规则和偏好，引发重复或不相关的 API 调用，迅速消耗预付额度。

rss · InfoQ 中文站 · May 12, 10:19

背景: CLAUDE.md 是一个放置在项目根目录的 Markdown 文件，为 Claude Code 代理提供持久的上下文和指令，涵盖代码风格、工作流程和 Bash 命令。Harness 工程是一种方法（由 Thoughtworks 推广），通过上下文工程、架构约束和持续反馈来建立对 AI 代理的信任，据报道 Anthropic 已将此法应用于 Claude Code。

参考链接

标签: #Claude Code, #Anthropic, #AI Coding Assistant, #CLAUDE.md, #Bug

Rockstar 如何将城市塞入 PS2 的 32MB 内存 ⭐️ 7.0/10

一个技术视频解释了 Rockstar Games 如何在仅有 32MB 内存的 PlayStation 2 上渲染整个开放城市。这展示了非凡的内存优化和流式加载技术，使得在硬件严重受限的情况下实现复杂的开放世界游戏，影响了后续的游戏开发和模拟工作。 PS2 的主内存仅 32MB，开发者必须从 DVD 实时流式传输世界数据，使用纹理压缩、程序化生成以及精细的细节层次管理等技术。

rss · Lobsters · May 12, 14:11

背景: PlayStation 2 于 2000 年发布，拥有 128 位 CPU 但仅有 32MB 系统内存，运行大型 3D 世界极为困难。Rockstar 的《侠盗猎车手》系列通过从光盘流式传输几何和纹理（即关卡流式加载）将主机性能推向极限，这一技术成为了开放世界游戏设计的基石。

参考链接

标签: #game development, #memory optimization, #PS2, #Rockstar, #retro gaming

Rust 代码 mock 方法大全 ⭐️ 7.0/10

一篇博客文章探讨了在测试中模拟 Rust 代码的各种方法，涵盖了不同的库和策略。这篇全面的概述帮助 Rust 开发者选择合适的模拟策略，提升测试质量和生产力。文章可能涵盖 trait 模拟、手动模拟、mockall、mockiato 以及其他 Rust 专用测试工具，但提供的输入中没有详细内容。

rss · Lobsters · May 12, 15:17

背景: 模拟是一种测试技术，用模拟对象替换真实对象以隔离被测试代码。在 Rust 中，由于其所有权和类型系统，模拟可能具有挑战性。存在多种库和模式来简化模拟。

标签: #Rust, #testing, #mocking, #software engineering

消除 Cow 使 JSON 格式化器提速 42% ⭐️ 7.0/10

一位开发者通过移除 Rust JSON 格式化器中的写时复制（Cow）模式，改用直接所有权，消除了不必要的克隆操作，从而实现了 42% 的性能提升。这一优化表明，像 Cow 这样常用的模式在热点路径上可能带来额外开销，而基于性能分析的简化可以带来显著的性能提升。它强调了在系统编程中审视抽象成本的重要性。该优化将特定结构体中的 Cow<’_, str> 替换为 String，减少了分配和分支操作。42% 的提速是在 100KB JSON 文件的基准测试中测得的。

rss · Lobsters · May 12, 15:10

背景: 在 Rust 中，Cow（写时复制）是一种智能指针，提供写时克隆语义：它可以持有借用数据或拥有数据，仅在需要修改时进行克隆。虽然这在许多情况下避免了不必要的复制，但在性能关键的路径中，间接引用和运行时检查可能带来开销。这篇文章表明，有时使用更简单的拥有类型（如 String）可能比 Cow 更快。

参考链接

Cow in std::borrow - Rust

标签: #optimization, #Rust, #JSON, #performance, #copy-on-write

2026 年 Zig 与 Rust 对比：演变与权衡 ⭐️ 7.0/10

本文分析了截至 2026 年 Zig 与 Rust 的演变和权衡，对这两门系统编程语言进行了前瞻性对比。该对比对于系统程序员评估在新项目中采用哪种语言具有重要意义，因为两种语言都在不断成熟，并在安全性、性能和简洁性方面做出不同的权衡。文章可能涵盖截至 2026 年的语言演变，包括新特性、生态系统发展和社区采用情况，同时强调具体权衡，如内存安全与控制力、编译器成熟度等。

rss · Lobsters · May 11, 21:54

背景: Zig 和 Rust 是注重性能和底层控制的现代系统编程语言。Rust 通过所有权系统在无需垃圾回收的情况下强调内存安全，而 Zig 则力求成为更简单、更实用的语言，支持手动内存管理和无缝 C 互操作。两者在系统开发中都获得了显著关注，Rust 得到了 Mozilla 和后来的 Rust 基金会的支持，Zig 则通过社区支持不断成长。

标签: #Zig, #Rust, #systems programming, #comparison

Guix 宣布跨频道时间旅行 ⭐️ 7.0/10

GNU Guix 宣布了一项新功能，允许跨不同 Guix 频道进行时间旅行，使用户能够从任何频道的任何历史修订版本重现环境。这一增强显著提高了可重现性，即使依赖关系跨越多个频道也能实现精确的环境重建，使依赖确定性构建的开发者和研究人员受益。该功能可能基于现有的 guix time-machine 命令构建，扩展支持多个频道规范，从而在所有配置的频道上实现统一的时间旅行。

rss · Lobsters · May 12, 15:11

背景: GNU Guix 是一个函数式包管理器，采用声明式方法。其时间机器允许用户回到 Guix 自身的历史中，重建相同的软件环境。以前，时间旅行仅限于主 Guix 频道；新功能消除了这一边界，允许跨频道时间旅行。

参考链接

标签: #GNU Guix, #reproducible builds, #package management, #time travel

代理式编码是一个陷阱 ⭐️ 7.0/10

Lars Faye 最近的一篇文章指出，代理式编码（即使用自主 AI 代理进行软件开发）是一个陷阱，可能会削弱开发者的技能和代码质量。随着代理式编码工具的日益流行，这篇批评对软件工程界来说很重要，需要反思过度依赖 AI 的风险，比如开发者专业技能的丧失和潜在的技术债务增加。文章警告说，自主规划、编写和修改代码的代理式编码系统可能会让开发者产生虚假的生产力感，而实际上却导致代码更难维护和调试。

rss · Lobsters · May 12, 15:11

背景: 代理式编码是一种软件开发方法，其中 AI 代理在最少人工干预的情况下独立规划、编写、测试和修改代码。与传统的 AI 编码助手（响应用户提示）不同，这些代理接受高级指令并在整个项目中自主执行。这种方法因可能加速开发而受到关注，但也引发了对开发者监督和代码质量的担忧。

参考链接

标签: #agentic coding, #AI-assisted development, #software engineering, #critique