前不久,龙虾的爆红让大家看到了一件事:个人设备是 AI 的大市场。
用户非常愿意在自己的设备上,运行 AI 完成各种任务。
这表明 AI 的个人电脑客户端有着广阔前景,绝不仅仅是提示词收发工具,而是一种通用工具。
各大厂商都看到了这一点,不约而同加强了电脑客户端,朝着通用工具的方向发展,比如 Anthropic 的 Claude Cowork 和 Computer Use、OpenAI 的 Codex 的功能都在扩展。
国内也不例外,千问最近就为自己的电脑版扩展了功能,上线语音输入法,大大加强了本地的智能办公。

我这几天一直在试用这个新版本,觉得新增的功能很不错,值得好好介绍一下。
二、千问电脑版我是从官网下载客户端,只有最新版才有新功能,如果以前安装过,需要更新一下。
安装后打开,就是下面的样子。

页面可以切换模型(下图),都是千问自家的模型,免费使用。

这些模型就不多说了,网上有很多评测,我们主要看它的新功能。
体验之前,你需要到“设置”菜单里面确认一下,“千问语音输入法”有没有打开。

智能语音就是这次千问更新的重头戏,也就是把电脑的语音功能跟 AI 结合起来。
三、全局唤起这次更新后,就可以用快捷键全局唤起千问。
什么是全局唤起?就是不管当前是什么环境,处于哪个窗口,只要用快捷键,就可以把千问唤出。
这样就能随时快速调用 AI,大大方便了日常使用。
默认的快捷键是右侧的 Alt 键(Windows 系统)或者右侧的 Command 键(Mac 系统),用几次就记住了。
四、智能语音输入按住快捷键,唤起的是智能语音输入。
这个功能就是通过电脑的麦克风,让 AI 模型处理接受到的语音。
这时,屏幕下方会出现一个提示符(下图)。

按着快捷键,千问就会一直识别输入的语音。松开按键,输入就停止了。
如果光标处在输入框内,识别出来的文字就会插入光标处。


经过我的测试,它的识别准确度非常高。上图就是中英混合语音的识别结果,可以看到没有错字,基本不用二次修改。你完全可以把它当做英文语音转文本的工具,非常方便。
此外,AI 模型还会对文本进行处理,自动去除语气词,修正口误,优化表达,结构化地呈现。
五、语音指令5.1 提问双击快捷键,可以直接向千问提问,屏幕下方会出现不一样的提示符。

跟上一节的语音输入相比,多了一行提示文字,让你直接提问。
说完问题后,再按一下快捷键,输入就会生效。它会打开一个小窗(下图),回答你的问题。

你也可以在小窗直接输入查资料,或者继续追问。
除了语音提问,它也支持划词提问,直接双击,让它解释,结果很快就出来了。
5.2 语音指令双击快捷键,不只是提问,还能向 AI 发出语音指令。
什么样的指令都可以,让千问查资料、翻译、记便签、做 PPT、整理表格……效率至少提升好几倍。
这时最好先打开“设置”菜单的“识别屏幕”选项,允许它识别屏幕(下图)。

这个选项会把屏幕画面作为上下文,一起输入模型,提高回答的针对性。
下面是我测试的几个常见场景。
5.2.1 文案润色在 Word(或其他办公软件)里面选择一段文字,可以让 AI 进行润色、翻译、总结等操作。
举例来说,选中一段很啰嗦的文字,发出语音指令“对选中文字进行润色”。

下面就是润色的结果。
5.2.2 撰写邮件发出语音指令,它可以替你写邮件。

上面就是 AI 根据对方来信,自动生成的邮件回复。你也可以给出内容要点,提出写作要求(比如希望写得更商务、更简练),让千问把内容扩展成一封完整的邮件。
5.2.3 记便签发出语音指令,还可以把信息摘录成便签。
举例来说,打开一个电商页面。

然后双击快捷键,说“帮我记商品价格”(指令格式是“帮我记xxx”),就会出触发便签功能,将指定的内容记入便签。
千问会打开一个便签小窗(下图),里面就是自动提取的相关内容,方便进一步处理。
5.2.4 PPT 和表格你还可以通过语音指令,让千问生成 PPT。

点击生成的文件,会打开内置的 PPT 编辑器,可以预览和手动编辑。

Excel 表格文件也可以生成。

六、总结试用以后,我的感觉是,千问选择了一个很巧妙的方向:为个人电脑加入一个语音模型,从而以很小的开发成本,进化为支持全局语音的电脑桌面 AI 助手。
表面上,这次只是方便用户动嘴,但其实是它从客户端开始转变为本地通用工具。
如果你的电脑办公学习需要 AI 辅助,可以试试这次的千问电脑版,零门槛、易上手、而且免费。本地安装后确实比使用网页版更方便。
(完)