Cartesia上线Sonic-3.5与Ink-2语音模型

2026-06-16 19:02

据午方 AI 消息，AI 语音初创企业 Cartesia 披露了 Sonic-3.5 与 Ink-2 两款核心模型，二者共同构建了统一的实时语音 AI 技术框架。

Sonic-3.5 聚焦文本转语音场景，音频输出延迟压缩至 90 毫秒，原生支持 42 种语言，并具备直接处理英语同形异义词及字母数字字符的能力，无需额外预处理。Ink-2 则负责语音转文本，单词错误率控制在 3.6%，通过语义理解判断说话结束点而非依赖静音时长，目前仅支持英语。开发者可通过单一 API 调用双向交互模型，有效降低多供应商集成带来的传输延迟与系统开销。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

灰度：Anthropic 关闭访问致 TAO 代币暴涨 30% 助推去中心化 AI

Jane Street 减持 71% IBIT 持仓，暗度陈仓收割链上预测市场

USD1 获 20 亿美元启动，链上美元化新路径

美伊停火引爆反弹，比特币冲至 67255 美元

WLFI 斥资 25 万美元赞助 UFC，USD1 流通量飙至 50 亿美元

JTO 代币单日暴涨 18.7%：JTX 上线与回购机制引爆行情

SpaceX 上市次日市值破 2.5 万亿美元，马斯克成万亿富翁

MiCA 宽限期 7 月 1 日终结，欧盟 75% 平台或关停

福克斯斥资 220 亿收购 Roku，Salesforce 36 亿吞并 Fin

以太坊开发者突破100万，SharpLink CEO 解析生态护城河