Mistral 推出 Voxtral 语音理解模型: 以开源提供出色正确率表现

IT之家7月16日消息，MistralAI当地时间昨日公布了其Voxtral语音理解模型。该系列模型以开源形式推出，可以更低价格提供领先的低错误率表现，支持真实世界的语音智能生产应用。

Voxtral系列模型由MistralSmall3.1派生而来，包括面向生产应用的24B版本VoxtralSmall和适用于本地/边缘部署的3B版本VoxtralMini，此外还有仅具备语音转文字功能的VoxtralMiniTranscribe。

该模型支持32KToken的上下文长度，可处理30分钟音频转录或40分钟音频理解，内置生成相关问题、结构化摘要的能力，支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

MistralAI宣称VoxtralMiniTranscribe在成本敏感用例中性能优于OpenAIWhisper，而价格不到后者的一半；而在高级用例方面，VoxtralSmall的性能与本领域顶尖模型ElevenLabsScribe接近，价格也不到一半。

万界最强boss发布网,提供万界最强boss发布信息,第一时间发布列表及资讯,万界最强主角是万界最强主角首选资讯平台。