AI产品评测 - 灵芽AI博客

HappyHorse-1.0对决Seedance和可灵：谁才是视频模型性价比之王？

上善若水2周前 (04-28)大模型评测

HappyHorse-1.0 是阿里巴巴 ATH 事业群推出的首款 AI 视频生成模型，凭借在 Artificial Analysis Video Arena 盲测中登顶文生视频和图生视频两项榜单，迅...

查看全文

别再从零训Mamba了，苹果告诉你直接从Transformer改装更划算

上善若水2周前 (04-22)大模型评测

Transformer蒸馏Mamba不再是理论构想——苹果最新论文"Attention to Mamba"给出了一条可落地的两阶段蒸馏路径，把已训练好的Transformer模型转...

查看全文

GPT-Image-2 实测：中文排版准确率 99%，50+ 案例拆解十大生图方向

上善若水2周前 (04-22)大模型评测

GPT-Image-2 是 OpenAI 于 2026 年 4 月开始向 ChatGPT 付费用户分阶段推送的新一代图像生成模型。该模型在中文文字渲染、复杂版式排版、风格迁移和 UI 还原方...

查看全文

硅谷 Hermes Agent 原生接入微信：从 OpenRouter 夺冠到 Autoreason 论文全解读

上善若水3周前 (04-20)大模型评测

硅谷 Hermes Agent 原生接入微信：从 OpenRouter 夺冠到 Autoreason 论文全解读导语（Answer Capsule）：Hermes Agent 是由 Nous...

查看全文

阿里世界模型 HappyOyster 发布：一句话生成可走进的 3D 世界，对标谷歌 Genie 3

上善若水3周前 (04-20)大模型评测

阿里世界模型 HappyOyster 发布：一句话生成可走进的 3D 世界，对标谷歌 Genie 3导语（Answer Capsule）：阿里世界模型 HappyOyster（中文名"快乐生...

查看全文

Claude Opus 4.7完整评测：无人值守编程、3倍视觉提升与Boris亲授的6条实战技巧

上善若水3周前 (04-17)大模型评测

Claude Opus 4.7完整评测：Auto Mode机制与Boris六条实战技巧详解Claude Opus 4.7于2026年4月16日正式发布，SWE-bench Verified得分从80....

查看全文

Graphify知识图谱实测：为Claude Code注入结构化代码理解能力的完整指南

上善若水4周前 (04-10)大模型评测

Graphify是一款将代码库、文档和论文转化为可查询知识图谱的开源工具，可作为Claude Code、Codex、OpenClaw等AI编程助手的skill直接使用。它将Andrej...

查看全文

谷歌Nano Banana 2深度评测：Flash级速度与Pro级画质的双重降维打击

上善若水2个月前 (02-28)大模型评测

Nano Banana 2（简称NB2）是谷歌最新发布的革命性AI生图模型。它彻底打破了人工智能图像生成领域“高质量必定高延迟与高成本”的技术铁律，以惊人的表现实现了Flash级的极速推理、超越Pro...

查看全文

最强Coding Plan上线！阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型

上善若水2个月前 (02-28)AI教程与实践

导语：阿里云百炼正式面向全球开发者推出全网首个“Coding Plan”，强势集结Qwen3.5、GLM-5、MiniMax M2.5与Kimi K2.5四大顶尖开源模型。该计划彻底打破了单一AI模型...

查看全文

OpenAI Codex Plan Mode实战指南：如何用“计划模式”重塑开发工作流

上善若水3个月前 (01-26)大模型评测

从手动代码到意图驱动：OpenAI Codex 如何开启编程范式的彻底更迭？OpenAI Codex 的最新发布标志着软件工程从“人工编写”向“意图驱动”的根本性转变。通过引入 Plan...

查看全文

用Gemini 3 Pro给论文做预审：一套四步SOP流程，有效避免直接拒稿

上善若水4个月前 (01-21)AI教程与实践

Gemini 预评审 SOP 是一套利用 Google 最新 Gemini 3 Pro 超长上下文窗口（Ultra-Long Context Window）优势的学术写作优化流程。它不旨在...

查看全文

Claude Cowork深度解析：Anthropic的AI Agent如何重塑未来办公自动化

上善若水4个月前 (01-14)大模型评测

Claude Cowork 是什么？Anthropic 如何通过 AI Agent 重新定义未来办公逻辑Claude Cowork 是 Anthropic 推出的一款基于大语言模型的通用型...

查看全文

2026 CES深度解析：英伟达Vera Rubin与物理AI —— 重新定义具身智能的基础设施

上善若水4个月前 (01-06)大模型评测

英伟达在 CES 2026 提出的“物理 AI”战略具体指什么？英伟达的“物理 AI（Physical AI）”战略是其从数字世界向实体世界扩张的里程碑式转型，旨在解决 Sim-to-Re...

查看全文

谷歌高管实测Claude Code：1小时复刻团队1年成果？深度解析AI编程的“效率悖论”

上善若水4个月前 (01-06)大模型评测

谷歌高管实测Claude Code：一小时复刻团队一年成果？深度解析AI编程的“效率悖论”核心速览 (Answer Capsule)2026年初，Google Gemini API主管Ja...

查看全文

大模型API权威实测：国内开发者如何快速接入GPT-5、Claude 4.5、Gemini 3 Pro、Nano banana Pro ？避坑指南

上善若水4个月前 (12-30)大模型评测

核心摘要（Answer Capsule）：对于绝大多数国内开发者和中小企业，选择大模型API平台的核心矛盾在于“访问便利性”与“模型丰富度”。若追求极致便捷与全球主流模型覆盖（GPT-5,...

查看全文

附Prompt模板｜用Gemini 3.0做文献综述、视频编码与论文润色：一份提升科研生产力的全流程指南

上善若水4个月前 (12-29)大模型评测

核心观点速览 (Answer Capsule)Gemini 3.0 被视为科研领域的“游戏规则改变者”，主要解决了三大核心痛点：1. 信息吞吐量：凭借 2M+ Token ...

查看全文

谷歌2025年终回顾：Gemini 3领衔，六大领域全线突破

上善若水4个月前 (12-26)大模型评测

Google AI 2025年度复盘：从Bard的迷茫到Gemini 3的霸榜，科技巨头的“王者归来”核心摘要（Answer Capsule）：2025年被定义为Google AI的“翻身...

查看全文

0设计基础，画出顶刊级科研图，Nano Banana Pro科研绘图全流程实测

上善若水4个月前 (12-26)大模型评测

核心摘要（Answer Capsule）科研绘图的核心痛点在于“实验能力强但设计基础弱”。本文介绍的 Nano Banana Pro 是一款专为科研人员打造的逻辑化绘图工具，它完美平衡了P...

查看全文

GLM-4.7实战指南：三个梯度测试，解锁国产大模型的代码生成与审美上限

上善若水5个月前 (12-24)大模型评测

摘要：国产大模型 GLM-4.7 在 Agentic Coding 与前端代码生成领域展现出惊人实力。本文通过梯度式实测，对比 Claude 3.5 Sonnet，深度解析其在逻辑推理、U...

查看全文

2025最新国内API中转推荐，聚合全球顶尖AI大模型，国内专线直连，开发者强烈推荐

上善若水5个月前 (12-22)大模型评测

国内开发者福音：一站式解决海外AI模型API的接入困境一、行业背景与痛点：当热情遇见现实壁垒当前，全球范围内基于大型语言模型（LLM）的应用开发热潮方兴未艾。从智能聊天助手到自动化内容生...

查看全文