驯化人工智能——它不会来,它已经到了
当邻居想要一个围栏可能长什么样的设想时,我毫不犹豫地让ChatGPT制作了一个模型。我拍了围栏的照片,让它在上面叠加一盆插在上面的茉莉花,经过几次调整,大约一分钟后,它给了我这个:
最近和潜水伙伴聊天时,他突然掏出手机说:“嘿,Grok,给我看看我们今天早上说的那台潜水电脑。”没错,那台电脑价值580美元,非常漂亮。
它的翻译能力非常出色,有时还让人忍俊不禁。它真的是巴别塔鱼。不久前我搬到一家银行,仅仅因为它比大公司早几年支持Apple Pay。那时,只需轻轻一按手腕就能支付,总能引发惊讶和评论。大约在同一时期,语音助手开始从新奇变得真正实用。设定计时器,预约时间,播放音乐。太棒了!
“Alexa,把厨房灯打开。”灯亮了。“不,关掉它。”“没有什么叫'它'的装置可以关闭。”哎呦!
没有记忆,没有背景。
这时Nabu登场了(是的,我知道,我还没来得及改wakeword的名字)。Naby知道它开了厨房灯,也知道我说“关掉”是指厨房灯。它会记住,它有上下文,因为它不再只是个愚蠢的语音助手,而是连接到了我的本地AI。
大型商业AI平台可以连接到这些系统,但本地运行意味着数据只能在我家的范围内。它还无法处理那堆文件,也无法赢得那场棘手的法律案件,但它能跟踪我家的状况,理解我自然说话时的意思。
这很重要——因为现在我不用再为那些死板的预设指令写和背那些枯燥的自动化,我可以用真人语言和Nabu交流,它能理解“所有灯光”或者“只有楼下的空调”。
就在五年前,在家运行AI模型还是个荒谬的提议——你需要数据中心硬件和技术兄弟预算。现在,它成本和操作都大幅降低——有了消费级GPU、迷你电脑、Ollama和Hugging Face,技术好奇的人们正悄悄在家中打造出令人惊讶的强大AI系统。我手中能拿的GPU无法与几个足球场那么大的数据中心竞争——但对于我的家庭实验室调试来说,它出乎意料地强大,而且还在不断增强。
我可能得稍微回溯一下——我对Home Assistant很感兴趣,我已经运行了大约12年——最初是在树莓派上运行,现在则在ProxmoxVE上的虚拟机中。传感器和控制器散布在房子各处,浏览器中的仪表盘充当任务控制。灯光自动化,配备定时器和存在感应器。日差调整百叶窗,窗帘对日出和日落产生反应,湿度传感器按需触发灌溉。太阳能和电池系统会根据电网的动态定价、买卖电力。
Home Assistant 宣布 2023 年为“语音之年”,并正式推出了原型语音助手。发布时,它的功能有限。如今,它在多种任务上表现出色,且全部开源,你可以用非常廉价的硬件构建自己的设备,软件也在 GitHub 上。
本地模型——Llama、Gemma、Mistral、Qwen——远远落后于大型商业系统,但在实验、家庭自动化和日常交互方面,它们正变得越来越可用。我个人关心数据主权(这本身就是一个庞大的话题),所以运行本地AI让我拥有更注重隐私的工作流程,即使互联网不存在,它依然能正常工作。
至于我本可以用GPU的价格获得多少个月的商业AI订阅,这个问题我刻意回避,主要是出于婚姻原因。我更倾向于把自己看作数据书呆子。所有这些传感器在“如果这样,那那样”的环境中收集所有数据,创造了无尽的调整可能性。随着AI驱动的Nabu逐渐取代Alexa,我的办公室越来越接近托尼·斯塔克的巢穴。我们已经不再是“部署Kubernetes集群”的难度,但它仍然是一个玩弄者的工具,而非主流消费设备。即便如此,这感觉也像是我们未来方向的预感。
奇怪的是,这一切很快就不再让人觉得陌生了。与一个理解上下文、记得之前对话并掌控我家的人工智能自然交流,可能会引发惊讶和评论。现在,它只是我服务器机架里安静地放着的另一件东西。
我打算叫它“雅菲尔”。

