&

當前位置：首頁 > 時尚 > AI語音輸入法正在偷偷擠走鍵盤

游客發(fā)表

AI語音輸入法正在偷偷擠走鍵盤

發(fā)帖時間：2025-12-25 13:10:10

[時尚] 來源：企業(yè)錄(www.falconvsmonkey.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶

如果幾年前有人跟我說，語音「你以后寫稿可能不怎么需要鍵盤了」，輸入我大概會把這句話當成一句玩笑。法正那時候我正處在對機械鍵盤的偷偷迷戀期，研究軸體、擠走鍵盤鍵帽、語音鍵程，輸入購入過 Cherry、法正Filco、偷偷NiZ、擠走鍵盤Keychron、語音3D 打印分體式鍵盤。輸入 甚至為了提高打字效率，法正專門學習過雙拼輸入法 。偷偷

我的擠走鍵盤注意力都放在消費的快感上，很少認真想過這樣一個問題：

敲鍵盤，真的是輸入的最優(yōu)解嗎？

真正的轉(zhuǎn)折，其實發(fā)生在我開始高頻使用各種 AI App 的這兩年。

第一次真正覺得「語音輸入這件事好像值得重視」，是各個 AI App 里那個「語音轉(zhuǎn)文字」按鈕變得越來越好用的時候。這些 App 里的語音轉(zhuǎn)寫，明顯比傳統(tǒng)輸入法里的語音要聰明得多：它不僅能聽清我在說什么，還能自動加上標點，幫我把一些口語化的表達整理得比較書面，甚至在我說得磕磕絆絆的時候，最后呈現(xiàn)出來的那一段文字讀起來仍然是順的。

主流的 AI 幾乎都覆蓋了語音轉(zhuǎn)文字功能｜圖片來源：極客公園

更關(guān)鍵的是，它和后面的 AI 是連在一起的——我說完一句話，看到的不只是干巴巴的轉(zhuǎn)寫結(jié)果，而是 AI 根據(jù)這段話給我的反饋和回答。那一刻我第一次有了一個直觀的感受： 語音不再只是一個「替代鍵盤的輸入方式」，而是直接接在 AI 交互前面的那一層 。

第二個真正改變我看法的，是我在和 AI 打交道的過程中，越來越清楚地意識到：語音比打字流暢得多。

和真人聊天不同，和 AI 交互時，我可以不管錯別字、不管格式；也不需要一上來就組織成一段「體面」的文字；甚至可以中途換一個角度，AI 依然能跟得上。

持續(xù)一段時間之后，我發(fā)現(xiàn)一個很直觀的變化：在越來越多的場景里，我不再想「敲一段字問它」，而是更想「按住麥克風直接說」。

01 Typeless 初體驗：🆘，它真的聽得懂我在說什么

我開始嘗試一些語音輸入法。

Wispr 算是其中名氣最大的一個，但真正用下來，其實很難令人滿意。它的轉(zhuǎn)錄速度略顯拖沓，會有一個較為尷尬的等待時間；中文識別的準確率也算不上理想，尤其是遇到一些專有名詞或者中英文混排的場景，經(jīng)常需要手動修補。

閃電說（原名：代體）走的是本地小模型路線，它幾乎把「速度」做到了極致，轉(zhuǎn)寫過程幾乎是「你剛說完，字就出來了」，而且完全免費。這種即時反饋在一開始確實給人非常強烈的爽感，第一次有了「手跟上腦子」的感覺。

但是也因為本地小模型的原因，它在準確率上就差強人意了。比如中英文混排、技術(shù)名詞夾雜口語、或者我說話節(jié)奏稍微快一點的時候，錯誤率會明顯上升。

我還嘗試過一些其他的語音輸入法，包括豆包輸入法（iOS 端）、微信輸入法、Whisper Keyboard，甚至是蘋果聽寫（因為更原生），但它們或多或少都因為一些問題而無法讓人完全滿意。

最后， 我就注意到了 Typeless，并且最終常駐在了我的電腦中 。

我之前曾經(jīng)簡單測試過各個語音輸入法，并做了一張四象限圖。Typeless 處于第二象限：速度中上，但文字的質(zhì)量最高。｜圖片來源：極客公園

如果和之前試過的那些工具相比，Typeless 帶來的改變并不在于「速度快了一兩秒」，而是在于 它大幅降低了出錯和返工的成本 。

很多語音輸入法的問題根本不在于轉(zhuǎn)錄的速度，而是它無法正確識別說話人的意圖，只要一兩個詞識別錯了，你就不得不打斷思路，回到文字里一點一點修改，整段體驗非常脆弱。

Typeless 給我的感覺剛好相反：它似乎真的理解「你想說什么」，而不是「你每個字到底是怎么說的」。哪怕我中途改口、補充、打斷自己，它也會盡量在結(jié)果里幫我拼出一個完整的、讀起來順暢的版本。

最直觀的改變是：我不需要再刻意湊近話筒了。為了更順暢地和 AI 交互，我之前特地買了一個麥克風放在顯示器左側(cè)。因為輸入法經(jīng)常識別不準，我總懷疑是不是距離太遠，于是下意識地把頭歪向麥克風。

但現(xiàn)在，這種習慣已經(jīng)自然消失了。

為了不遮擋屏幕，麥克風位于屏幕左側(cè)，因此距離會稍遠一些。

這些「理解意圖」的能力，在具體功能上體現(xiàn)得很直觀。比如說，我隨口一句「My shopping list, bananas, oat milk, dark chocolate」，在 Typeless 里看到的，不是一串用逗號隔開的原話，而是自動幫我排好的一份購物清單：前面有標題，下面是 1、2、3 的編號列表。

Typeless 可以把語音轉(zhuǎn)換成帶格式的文字｜圖片來源：極客公園

又比如，我在 Gmail 里選中一段略顯隨意的英文郵件，只需要對著 Typeless 說一句「Turn it into a professional email」，它會在原地把那段話改寫成一封語氣、結(jié)構(gòu)都更正式的郵件正文。

Typeless 可以把文字重寫成郵件格式

再比如，我復(fù)制了一段日文介紹到屏幕下半部分，對著 Typeless 說「翻譯成中文」，它會在幾秒鐘之內(nèi)給出一段順滑自然的譯文——不是逐字直譯，而是能讀得進去的那種中文。

Typeless 可以翻譯選中的文字

更有意思的一點，是它會根據(jù)你當前使用的 App 自動調(diào)整語氣。如果我在聊天軟件里，對它說話可以非常隨意，出來的結(jié)果也會刻意保留這種口語感；但在工作場景 App 里，Typeless 給出來的文字就會明顯正式很多，標點更規(guī)整。

根據(jù)不同 App 的上下文語境，Typeless 會調(diào)整說話的語氣

如果站在技術(shù)路線的角度看，這個轉(zhuǎn)變背后其實是從傳統(tǒng) ASR 到大語言模型的變化。過去的語音輸入，核心任務(wù)是識別——把聲音轉(zhuǎn)成文字，最好一個字不差。

而現(xiàn)在，大模型可以在同一個流程里同時做識別和理解： 它不只在「聽你說什么」，更在「猜你想表達什么」 。實際的直觀感受就是：以前我說話的時候要照顧機器，現(xiàn)在更多是機器在試圖適應(yīng)我的表達習慣。我會明顯感覺到，Typeless 并不是簡單地把我的每一句話「抄」下來，而是連著前后的上下文，一起去判斷這段話應(yīng)該長成什么樣。

正因為有這一層模型能力和「語氣感知」的變化，Typeless 在我的日常工作流程里，很快就從「可以試一試的新玩具」，變成了一個真正可以排在鍵盤旁邊的位置。

以前我總覺得自己是在「用語音替代打字」，現(xiàn)在回過頭來看，這種替代關(guān)系反而調(diào)轉(zhuǎn)過來了： 鍵盤更像是一個用來收尾和微調(diào)的工具，而大段的內(nèi)容輸入，已經(jīng)可以放心交給語音和 Typeless 。

02 幾乎沒有「缺點」，但有三點擔憂

如果單純從「工具好不好用」這個角度來評價，Typeless 在我這兒其實很難挑出什么硬傷。識別足夠穩(wěn)，意圖理解在絕大多數(shù)場景下靠譜，桌面端集成順滑，免費額度對個人用戶來說也夠用（每周 4000 詞）。

在使用 Typeless 的 20 天中，我總共輸入了接近 8000 詞，平均每天 200 詞

真正令人擔心的地方，反而不在產(chǎn)品本身，而在它所處的環(huán)境。

第一個擔憂是大公司的入場。當你把 Typeless 當成日常工作的核心輸入層時，很難不去想象另外一種可能性：如果哪一天，操作系統(tǒng)自己提供了一套同樣水準、甚至更強的語音輸入能力，而且是系統(tǒng)級的、無處不在的，那我還有多少理由堅持使用一個第三方工具？

從歷史上看，很多優(yōu)秀的第三方工具，最終都被系統(tǒng)抄到一個「八十分好用」的程度，然后慢慢失去了存在感。語音輸入這件事，也很有可能走到同樣的節(jié)點。 例如字節(jié)跳動就推出了體驗非常優(yōu)秀的豆包輸入法，加之最近討論很熱烈的豆包手機，這種情況是很有可能在不久的將來發(fā)生 。

第二個擔憂是免費本地模型陣營的持續(xù)擠壓。閃電說這樣的工具，哪怕今天體驗不算完美，但它不斷提醒用戶一件事：語音識別其實可以在本地設(shè)備上完成，而且零成本。隨著硬件繼續(xù)演進、本地模型持續(xù)變強，這一陣營的體驗只會越來越好， 用戶對「語音轉(zhuǎn)文字這件事本身應(yīng)該是免費的」這種預(yù)期，很難完全逆轉(zhuǎn) 。

Typeless 目前用更高的免費額度和更好的整體體驗，在一定程度上對沖了這種心理落差，但長遠來看，它仍然要回答一個問題：在一個「到處都是不錯的免費方案」的世界里，它能一直給用戶什么額外的價值，讓那 12 美元每個月看起來是值得的。

Typeless的付費套餐為每月12美元，提供無限次的轉(zhuǎn)錄｜圖片來源：Typeless 官網(wǎng)

第三個不算「擔憂」，更像是現(xiàn)實的約束，就是 iOS 端的體驗。因為 iOS 的系統(tǒng)限制，使用 Typeless 必須跳轉(zhuǎn) App，這在使用體驗上是非常致命的打擊。Typeless 想出的應(yīng)對方案是讓麥克風在后臺常駐，但這同時又會帶來隱私和功耗的問題。

這些問題不是 Typeless 一家可以獨自解決的，它需要的是操作系統(tǒng)本身的配合。而這又回到了第一個問題：一旦像蘋果這種系統(tǒng)級別的廠商跟進，打擊將是致命的。

03 鍵盤，會被取代到什么程度

回頭看這幾年自己折騰輸入工具的歷程，我越來越強烈地意識到一個事實：我們過去為鍵盤付出的那些努力，很大一部分是在幫一套并不那么「順手」的設(shè)計擦屁股。

QWERTY 布局本身并不是為了人體工學而生，它誕生于機械打字機時代，核心目的是降低卡紙、讓金屬字桿別那么容易打結(jié)。為了照顧機器，我們刻意犧牲了一部分人的效率，然后再用盲打訓練、打字課和大量練習，把這種妥協(xié)牢牢刻進自己的肌肉記憶里。

最開始的打字機并不是 QWERTY 布局。1873 年，美國人 Christopher Sholes，將常用的字母組合分開排列，降低打字速度，以解決因按鍵復(fù)位機制緩慢而導(dǎo)致的打字卡頓問題，最終形成了 QWERTY 布局｜圖片來源：Wikipedia

機械鍵盤、分體式鍵盤、各種人體工學鍵盤，本質(zhì)上都還停留在這種框架之內(nèi)：我們在既定的格子里，想辦法讓手指跑得沒那么累。

語音則完全是另外一條路。說話這件事，本來就是人類最自然的輸出方式之一。我們從小就學會用聲音組織情緒和思想，所有的停頓、轉(zhuǎn)折、插話、反悔，都是在這種流動里長出來的。

真正開始高頻用語音和 AI 交互之后，我才發(fā)現(xiàn)，所謂「自然輸入方式」不只是速度快一點，而是它把我從很多不必要的負擔里解放了出來：不用在意是不是每個字都敲對，不用提前把句子構(gòu)造好，不用為了照顧輸入法刻意改變自己的表達習慣。我可以像和人說話一樣把一件事情講清楚，剩下的交給模型去理解、去整理。

Typeless 這一類軟件，站在這個趨勢上做了一步更激進的嘗試。它并不滿足于當一個「語音版鍵盤」，而是很明顯地在向系統(tǒng)級能力靠攏：在桌面端，它試圖成為一層獨立于具體 App 之上的輸入層；在 iOS 端，它干脆取消了鍵盤，把「說話」設(shè)定為默認動作。

在 iOS 端，Typeless 做得非常激進，直接取消了鍵盤輸入，僅保留語音輸入｜圖片來源：極客公園

這種野心讓我看到了一些想象空間：如果有一天，操作系統(tǒng)層真的接受了「語音優(yōu)先」的前提，把類似 Typeless 的能力直接做進系統(tǒng)，也許我們今天習慣的很多交互細節(jié)都會被改寫。

當然，這一切目前都還停留在可能性層面。大公司會不會愿意把這件事做到極致，用戶會不會接受一套以語音為主的新習慣，監(jiān)管和隱私會怎么演化，這些問題誰都說不準。

對我來說，唯一可以確認的，是它已經(jīng)在「輸入效率」這個非常具體的指標上，給出了一個足夠有說服力的答案： 在很多場景里，我可以用更短的時間，把更多的信息、更完整的語義輸入到電腦里，而且中間少了很多和鍵盤搏斗的環(huán)節(jié) 。

哪怕最終 Typeless 沒能長成一個真正的「系統(tǒng)級存在」，這部分被釋放出來的效率和注意力，大概也已經(jīng)足夠說明一件事——輸入方式這件事，我們完全有理由重新想象。

分享到：新浪微博 QQ空間騰訊微博人人網(wǎng) 點點網(wǎng) 復(fù)制網(wǎng)址打印

相關(guān)內(nèi)容

一加Turbo來了：定制165Hz京東方旗艦屏同檔唯一
中超第29輪：爭冠、保級懸念留至終章
（粵港澳全運會）十五運會跳水女雙10米臺陳芋汐/掌敏潔奪冠
第十五屆全國運動會火炬?zhèn)鬟f在粵港澳三地四城同步舉行
評論：大力神杯“重返”中國，中國男足何時重返世界杯？
“一帶一路”國家駐華使節(jié)自行車系列賽在四川樂山大渡河畔啟幕
2025中國公路自行車公開賽收官戰(zhàn)鳴笛
中足聯(lián)發(fā)文細化“觀眾不當行為”

隨機閱讀

熱門排行

国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

AI語音輸入法 正在偷偷擠走鍵盤

AI語音輸入法正在偷偷擠走鍵盤