只读信息流

今日情报

今日 15 条推荐,5 条新消息,已保留 14 次历史推送,另有 118 条候选未进主列表。这是只读分享页,不连接私人控制台。

推送时间 07/01 21:34
15主推
5新消息
14历史
118未展示

今天

今日推荐

15 条

What's new in Claude Sonnet 5

新消息中可信Simon Willison重大变化发布 07/01 05:23 · 收录 07/01 21:32

基于标题和来源判断:这条指向 Fable 5/Mythos 5 访问被政府或监管限制。先核官方声明、影响范围、限制对象和恢复条件。

看点先判断这件事影响的是模型可用性、资金安全、服务稳定性还是监管边界,再决定是否跟踪。

高 5 打开原文

宝玉 评价 Claude Fable 5 / Mythos 5 的能力变化

新消息中可信宝玉 (@dotey)重大变化同题 3 篇发布 07/01 08:39 · 收录 07/01 10:09

宝玉 在 X 上讨论 Claude Fable 5 / Mythos 5:这条线索指向模型能力、安全保护和长任务软件工程表现的变化,适合优先核对官方发布、限制条件和真实使用反馈。

看点它可能直接改变模型可用性、地区限制、身份限制和后续 AI 供应链判断。

高 5 打开原文

OpenRouter 关注 GLM 5.2 的推理服务表现

新消息中可信OpenRouter (@openrouter)一手账号同题 1 篇发布 07/01 07:18 · 收录 07/01 21:33

OpenRouter 关注 GLM 5.2 的模型表现和推理服务供给,重点在开源/开放模型是否能通过高速推理平台进入实际工作流,适合继续观察 Groq、Cerebras 等部署进展。

看点X 一手账号信号,适合捕捉平台人物和前线观点;X 一手线索,适合核实行业人物和官方即时动向

高 5 打开原文

A2A 如何构建协作型 Agent 世界

历史入档高可信Google Developers Blog技术/工具发布 01/01 08:00 · 首次收录 06/20 21:31

Google 以 A2A 协议一周年为节点,展示 autonomous AI agents 如何安全协作、交接任务并降低上下文污染;案例包括生命科学里的 FoldRun,以及电商、数据流、DevOps、通信等场景,适合继续观察跨 Agent 协作是否进入真实工作流。

看点重点不是单个模型能力,而是智能体上线后如何做实时监控、误用防护、权限边界和可靠性控制。

高 5 打开原文

A2UI + MCP 应用:结合声明式界面和自定义 Agent UI

历史入档高可信Google Developers Blog补充发布 01/01 08:00 · 首次收录 06/20 21:31

Google 提出 A2UI 与 MCP Apps 的三种组合架构,用来在原生声明式界面和复杂 iframe 应用之间取平衡;重点是让 Agent UI 同时具备安全、性能和品牌一致性,适合跟踪 MCP 应用前端形态。

看点重点不是单个模型能力,而是智能体上线后如何做实时监控、误用防护、权限边界和可靠性控制。

高 4 打开原文

Google 发布 Agent 资源发现规范

历史入档高可信Google Developers Blog补充发布 01/01 08:00 · 首次收录 06/20 21:31

Google 发布 Agentic Resource Discovery 开放规范,目标是让 Agent 能在 Web 上发现并验证工具、skills 和其他 agents;它解决的是工具目录、身份验证和可信发现问题,适合跟踪 Agent 生态的底层协议变化。

看点它试图解决 Agent 在 Web 上找工具、确认发布者身份、再调用能力的问题,属于 Agent 生态底层目录和信任机制。

高 4 打开原文

库克与欧盟科技主管就新版Siri AI 举行建设性会谈

新消息中可信IT之家(RSS)可读补充发布 07/01 07:43 · 收录 07/01 21:32

苹果CEO库克与欧盟科技事务负责人维尔库宁就新版Siri AI在欧推出举行建设性视频会议。新版Siri将转为可调用用户个人数据的聊天机器人,但因《数字市场法》互操作义务苹果拒绝向竞争对手开放同等数据权限,暂不在欧盟iPhone和iPad上推出。苹果提出"可信系统代理"方案,拟在设备与第三方AI模型间增加软件层,但未开发,并要求18个月监管宽限期,遭欧盟拒绝…

看点这条可能改变模型或 Agent 的能力边界,但要先确认评测、限制和适用场景。

高 4.4 打开原文

Acti 将 AI 智能体直接放入手机键盘

新消息中可信TechCrunch:AI(RSS)技术/工具发布 07/01 01:52 · 收录 07/01 21:32

新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘,可代替用户在应用中执行操作。核心功能 Skills 允许用自然语言创建快捷方式,如长按 T 键翻译消息、C 键发送会议链接。早期测试者两周内创建超 1000 个 Skills。采用本地优先架构,默认不访问私人消息。公司获 530 万美元种子轮融资,由 BITKRAFT Ventu…

看点它试图解决 Agent 在 Web 上找工具、确认发布者身份、再调用能力的问题,属于 Agent 生态底层目录和信任机制;目前证据还薄,先确认原文细节和限制。

高 5 打开原文

Greg Brockman 发布一条 X 一手线索

历史入档中可信Greg Brockman (@gdb)一手账号同题 4 篇发布 06/29 12:41 · 首次收录 07/01 08:32

Greg Brockman 在 X 上发布了这条一手线索。原文要点:Sol & Daybreak

看点X 一手账号信号,适合捕捉平台人物和前线观点;X 一手线索,适合核实行业人物和官方即时动向;模型能力或 Agent 形态变化,重点看是否改变任务完成方式

高 4 打开原文

Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

历史入档中可信Simon Willison模型待核发布 06/30 00:17 · 首次收录 06/30 19:42

基于标题和来源判断:这条主要关注「Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding」。这是一条技巧或观点内容,适合判断是否值得沉淀成方法。

看点它可能变成可复用流程,适合看步骤、依赖、成本和是否能迁移到你的工作流。

中 3.7 打开原文

Qwen 3.6 27B 是本地开发的理想选择

历史入档中可信Hacker News 热门(buzzing.cc 中文翻译)模型待核发布 06/30 02:03 · 首次收录 06/30 19:42

基于标题和来源判断:这条主要关注「Qwen 3.6 27B 是本地开发的理想选择」。这是一条技巧或观点内容,适合判断是否值得沉淀成方法。

看点这条可能变成可复用流程,但要先确认步骤、成本和依赖是否真实可执行。

中 3.7 打开原文

Anthropic:当 AI 成本超过工程师薪酬

历史入档中可信Tomer Tunguz 博客(VC 分析)补充发布 06/29 08:00 · 首次收录 06/30 19:42

Anthropic在算力上的支出达到每位工程师每年51.5万美元,是其完全薪资(22.4万美元)的2.3倍。相比之下,顶尖1%软件公司的算力支出为8.9万美元,中位数仅为1.37万美元。三个2029年情景预测了这一差距的缩小路径。

看点这条可能影响你对模型训练、数据瓶颈或 Agent 能力边界的判断,但要先看原文证据。

中 3.6 打开原文

AI 就业争论变得更加混乱

历史入档中可信TechCrunch:AI(RSS)补充发布 06/30 12:01 · 首次收录 06/30 19:42

截至2026年5月,AI相关裁员接近9万个,预计未来五年美国最多15%的岗位将被AI替代。但Ramp与Revelio Labs对近22,000家公司的报告发现,高AI投入企业(前三个月人均月均支出30美元)总员工数增长10.2%,入门级岗位增长12%。报告认为AI并非普遍导致岗位消失,而是在资源充裕的科技企业里成为扩张工具--降低工程、销售、客服等职能的生…

看点这条可能变成可复用流程,但要先确认步骤、成本和依赖是否真实可执行。

高 5 打开原文

LongCat-2.0, a large-scale MoE model with 1.6T total 和 48B Active

历史入档低可信Hacker News Newest 100+模型待核发布 06/30 08:30 · 首次收录 06/30 19:43

基于来源短摘可判断:基于标题和来源判断:这条主要关注「LongCat-2.0, large-scale MoE model 借助 1.6T total 和 48B Active」。这是一条前沿观察,适合用来捕捉新产品、新玩法或早期趋势。

看点先别采信结论;这条可能改变模型或 Agent 的能力边界,但要先确认评测、限制和适用场景。

中 2.8 打开原文

美团 LongCat 发布旗舰模型 LongCat-2.0

历史入档中可信X:硅基流动 SiliconFlow (@SiliconFlowAI)模型待核发布 06/30 13:42 · 首次收录 06/30 19:42

基于标题和来源判断:这条主要关注「美团 LongCat 发布旗舰模型 LongCat-2.0」。这是一条 AI 模型更新,适合关注能力边界、成本或可用性变化。

看点这条可能改变模型或 Agent 的能力边界,但要先确认评测、限制和适用场景。

中 3.7 打开原文