言犀键盘-基于 AI 的智能语音输入法.3.0版本重大更新

flynn 336

3.0.0版本开始,可以直接使用设置功能中的本地模型!无需另外配置ASR模型

目前已支持sensevoice small作为本地模型,共有两个版本:

int8版本,模型体积226mb,运行时软件内存占用共约700MB,实测8gen3机型预热模型需要4s左右,加载完成后启用NNAPI以及4线程推理,识别单句话的延迟在70-80ms左右,非常迅速
无量化版本,模型体积886mb,运行时软件内存占用共约2G,实测8gen3机型预热模型需要8s左右,加载完成后识别单句话的延迟在200ms左右,延迟依然远低于在线模型
后续可能还会加入TeleSpeechASR模型,在方言识别上更具优势.
PS:模型解压和验证所需时间较长,请耐心等待,防止文件损坏导致应用闪退

言犀键盘 是我朋友开发的一款非常优秀的基于 AI 的智能语音输入法.识别速度极快(言出法随),准确率极高.方言友好(我也提供了一些开发方向及思路并参与了小部分开发工作😄)非常适合语音输入的场景,对于不善于文字输入的人群来说非常的友好.

本文主要提供配置教程和具体的介绍可以移步 项目github主页

首先下载言犀键盘,这里提供两个个国内友好的下载地址
APP下载地址(国内)

蓝奏网盘:密码 akw5

下载后打开APP就是设置界面
image.png

第一次使用请点击授予所有需要的权限并且在弹出的询问窗口中选择同意

配置无障碍:(非必需)

为了避免因权限不足导致的语音识别错误,建议开启无障碍.通常情况下 APP会直接引导到无障碍设置界面,也可以自行通过手机系统设置进入无障碍开启无障碍权限.

a064c2ba6a09ec2d1f36fb0df480e798.jpg

配置ASR模型(重要)

言犀键盘支持各大平台的ASR模型配置,这里以体验最好的火山引擎(豆包)和阿里云百炼(Qwen)为例. 两个平台都提供了足够的免费额度.

产品名称 价格 速度 流式输入支持
Doubao-语音识别 更高 更快 支持
Qwen3-ASR 更低 适中 不支持

火山引擎(豆包)

进入火山引擎控制台 点击左侧菜单栏的模型广场选择doubao-录音文件识别.如下图

image.png

进入模型页面后点击立即使用

image.png

选择极速版,开通界面如下:复制APP ID和Access Token备用

image.png

打开APP的ASR设置,ASR服务商选择Volcano Engine
鉴权参数分别填入
X-Api-App-Key:填入之前的保存的APP ID
X-Api-Access-Key:填入之前保存的Access Token
建议开启 流式识别

阿里云百炼(Qwen-ASR)

Qwen的设置相对简单
进入 阿里云百炼控制台 点击左侧菜单的最下方的密钥管理,新建密钥.ASR设置中服务商选择阿里云百炼 把新建的密钥粘贴到API KEY中 模型保持默认的qwen3-asr-flash不变即可!

建议的悬浮球设置

下图是我的悬浮球设置,能在不影响默认输入法的情况下显示一个可见度不高的的语音悬浮球~点击即可进行语音输入. 你可以根据自己需求来修改悬浮球的大小和透明度

e0d3a11427ca935b62771bb520973ed0.jpg

如果使用中有任何的建议请到github提交issue

这家伙太懒了,什么也没留下。
最新回复 (0)
    提示:您必须 登录 后才能查看此内容
返回
发布新帖