国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

游客發(fā)表

AI語音輸入法 正在偷偷擠走鍵盤

發(fā)帖時間:2025-12-25 13:10:10

如果幾年前有人跟我說,語音「你以后寫稿可能不怎么需要鍵盤了」,輸入我大概會把這句話當成一句玩笑。法正那時候我正處在對機械鍵盤的偷偷迷戀期,研究軸體、擠走鍵盤鍵帽、語音鍵程,輸入購入過 Cherry、法正Filco、偷偷NiZ、擠走鍵盤Keychron、語音3D 打印分體式鍵盤。輸入 甚至為了提高打字效率,法正專門學習過雙拼輸入法 。偷偷

我的擠走鍵盤注意力都放在消費的快感上,很少認真想過這樣一個問題:

敲鍵盤,真的是輸入的最優(yōu)解嗎?

真正的轉(zhuǎn)折,其實發(fā)生在我開始高頻使用各種 AI App 的這兩年。

第一次真正覺得「語音輸入這件事好像值得重視」,是各個 AI App 里那個「語音轉(zhuǎn)文字」按鈕變得越來越好用的時候。這些 App 里的語音轉(zhuǎn)寫,明顯比傳統(tǒng)輸入法里的語音要聰明得多:它不僅能聽清我在說什么,還能自動加上標點,幫我把一些口語化的表達整理得比較書面,甚至在我說得磕磕絆絆的時候,最后呈現(xiàn)出來的那一段文字讀起來仍然是順的。

主流的 AI 幾乎都覆蓋了語音轉(zhuǎn)文字功能|圖片來源:極客公園

更關(guān)鍵的是,它和后面的 AI 是連在一起的——我說完一句話,看到的不只是干巴巴的轉(zhuǎn)寫結(jié)果,而是 AI 根據(jù)這段話給我的反饋和回答。那一刻我第一次有了一個直觀的感受: 語音不再只是一個「替代鍵盤的輸入方式」,而是直接接在 AI 交互前面的那一層 。

第二個真正改變我看法的,是我在和 AI 打交道的過程中,越來越清楚地意識到:語音比打字流暢得多。

和真人聊天不同,和 AI 交互時,我可以不管錯別字、不管格式;也不需要一上來就組織成一段「體面」的文字;甚至可以中途換一個角度,AI 依然能跟得上。

持續(xù)一段時間之后,我發(fā)現(xiàn)一個很直觀的變化:在越來越多的場景里,我不再想「敲一段字問它」,而是更想「按住麥克風直接說」。

01 Typeless 初體驗:🆘,它真的聽得懂我在說什么

我開始嘗試一些語音輸入法。

Wispr 算是其中名氣最大的一個,但真正用下來,其實很難令人滿意。它的轉(zhuǎn)錄速度略顯拖沓,會有一個較為尷尬的等待時間;中文識別的準確率也算不上理想,尤其是遇到一些專有名詞或者中英文混排的場景,經(jīng)常需要手動修補。

閃電說(原名:代體)走的是本地小模型路線,它幾乎把「速度」做到了極致,轉(zhuǎn)寫過程幾乎是「你剛說完,字就出來了」,而且完全免費。這種即時反饋在一開始確實給人非常強烈的爽感,第一次有了「手跟上腦子」的感覺。

但是也因為本地小模型的原因,它在準確率上就差強人意了。比如中英文混排、技術(shù)名詞夾雜口語、或者我說話節(jié)奏稍微快一點的時候,錯誤率會明顯上升。

我還嘗試過一些其他的語音輸入法,包括豆包輸入法(iOS 端)、微信輸入法、Whisper Keyboard,甚至是蘋果聽寫(因為更原生),但它們或多或少都因為一些問題而無法讓人完全滿意。

最后, 我就注意到了 Typeless,并且最終常駐在了我的電腦中 。

我之前曾經(jīng)簡單測試過各個語音輸入法,并做了一張四象限圖。Typeless 處于第二象限:速度中上,但文字的質(zhì)量最高。|圖片來源:極客公園

如果和之前試過的那些工具相比,Typeless 帶來的改變并不在于「速度快了一兩秒」,而是在于 它大幅降低了出錯和返工的成本 。

很多語音輸入法的問題根本不在于轉(zhuǎn)錄的速度,而是它無法正確識別說話人的意圖,只要一兩個詞識別錯了,你就不得不打斷思路,回到文字里一點一點修改,整段體驗非常脆弱。

Typeless 給我的感覺剛好相反:它似乎真的理解「你想說什么」,而不是「你每個字到底是怎么說的」。哪怕我中途改口、補充、打斷自己,它也會盡量在結(jié)果里幫我拼出一個完整的、讀起來順暢的版本。

最直觀的改變是:我不需要再刻意湊近話筒了。為了更順暢地和 AI 交互,我之前特地買了一個麥克風放在顯示器左側(cè)。因為輸入法經(jīng)常識別不準,我總懷疑是不是距離太遠,于是下意識地把頭歪向麥克風。

但現(xiàn)在,這種習慣已經(jīng)自然消失了。

為了不遮擋屏幕,麥克風位于屏幕左側(cè),因此距離會稍遠一些。

這些「理解意圖」的能力,在具體功能上體現(xiàn)得很直觀。比如說,我隨口一句「My shopping list, bananas, oat milk, dark chocolate」,在 Typeless 里看到的,不是一串用逗號隔開的原話,而是自動幫我排好的一份購物清單:前面有標題,下面是 1、2、3 的編號列表。

Typeless 可以把語音轉(zhuǎn)換成帶格式的文字|圖片來源:極客公園

又比如,我在 Gmail 里選中一段略顯隨意的英文郵件,只需要對著 Typeless 說一句「Turn it into a professional email」,它會在原地把那段話改寫成一封語氣、結(jié)構(gòu)都更正式的郵件正文。

Typeless 可以把文字重寫成郵件格式

再比如,我復(fù)制了一段日文介紹到屏幕下半部分,對著 Typeless 說「翻譯成中文」,它會在幾秒鐘之內(nèi)給出一段順滑自然的譯文——不是逐字直譯,而是能讀得進去的那種中文。

Typeless 可以翻譯選中的文字

更有意思的一點,是它會根據(jù)你當前使用的 App 自動調(diào)整語氣。如果我在聊天軟件里,對它說話可以非常隨意,出來的結(jié)果也會刻意保留這種口語感;但在工作場景 App 里,Typeless 給出來的文字就會明顯正式很多,標點更規(guī)整。

根據(jù)不同 App 的上下文語境,Typeless 會調(diào)整說話的語氣

如果站在技術(shù)路線的角度看,這個轉(zhuǎn)變背后其實是從傳統(tǒng) ASR 到大語言模型的變化。過去的語音輸入,核心任務(wù)是識別——把聲音轉(zhuǎn)成文字,最好一個字不差。

而現(xiàn)在,大模型可以在同一個流程里同時做識別和理解: 它不只在「聽你說什么」,更在「猜你想表達什么」 。實際的直觀感受就是:以前我說話的時候要照顧機器,現(xiàn)在更多是機器在試圖適應(yīng)我的表達習慣。我會明顯感覺到,Typeless 并不是簡單地把我的每一句話「抄」下來,而是連著前后的上下文,一起去判斷這段話應(yīng)該長成什么樣。

正因為有這一層模型能力和「語氣感知」的變化,Typeless 在我的日常工作流程里,很快就從「可以試一試的新玩具」,變成了一個真正可以排在鍵盤旁邊的位置。

以前我總覺得自己是在「用語音替代打字」,現(xiàn)在回過頭來看,這種替代關(guān)系反而調(diào)轉(zhuǎn)過來了: 鍵盤更像是一個用來收尾和微調(diào)的工具,而大段的內(nèi)容輸入,已經(jīng)可以放心交給語音和 Typeless 

02 幾乎沒有「缺點」,但有三點擔憂

如果單純從「工具好不好用」這個角度來評價,Typeless 在我這兒其實很難挑出什么硬傷。識別足夠穩(wěn),意圖理解在絕大多數(shù)場景下靠譜,桌面端集成順滑,免費額度對個人用戶來說也夠用(每周 4000 詞)。

在使用 Typeless 的 20 天中,我總共輸入了接近 8000 詞,平均每天 200 詞

真正令人擔心的地方,反而不在產(chǎn)品本身,而在它所處的環(huán)境。

第一個擔憂是大公司的入場。當你把 Typeless 當成日常工作的核心輸入層時,很難不去想象另外一種可能性:如果哪一天,操作系統(tǒng)自己提供了一套同樣水準、甚至更強的語音輸入能力,而且是系統(tǒng)級的、無處不在的,那我還有多少理由堅持使用一個第三方工具?

從歷史上看,很多優(yōu)秀的第三方工具,最終都被系統(tǒng)抄到一個「八十分好用」的程度,然后慢慢失去了存在感。語音輸入這件事,也很有可能走到同樣的節(jié)點。 例如字節(jié)跳動就推出了體驗非常優(yōu)秀的豆包輸入法,加之最近討論很熱烈的豆包手機,這種情況是很有可能在不久的將來發(fā)生 。

第二個擔憂是免費本地模型陣營的持續(xù)擠壓。閃電說這樣的工具,哪怕今天體驗不算完美,但它不斷提醒用戶一件事:語音識別其實可以在本地設(shè)備上完成,而且零成本。隨著硬件繼續(xù)演進、本地模型持續(xù)變強,這一陣營的體驗只會越來越好, 用戶對「語音轉(zhuǎn)文字這件事本身應(yīng)該是免費的」這種預(yù)期,很難完全逆轉(zhuǎn) 

Typeless 目前用更高的免費額度和更好的整體體驗,在一定程度上對沖了這種心理落差,但長遠來看,它仍然要回答一個問題:在一個「到處都是不錯的免費方案」的世界里,它能一直給用戶什么額外的價值,讓那 12 美元每個月看起來是值得的。

Typeless的付費套餐為每月12美元,提供無限次的轉(zhuǎn)錄|圖片來源:Typeless 官網(wǎng)

第三個不算「擔憂」,更像是現(xiàn)實的約束,就是 iOS 端的體驗。因為 iOS 的系統(tǒng)限制,使用 Typeless 必須跳轉(zhuǎn) App,這在使用體驗上是非常致命的打擊。Typeless 想出的應(yīng)對方案是讓麥克風在后臺常駐,但這同時又會帶來隱私和功耗的問題。

這些問題不是 Typeless 一家可以獨自解決的,它需要的是操作系統(tǒng)本身的配合。而這又回到了第一個問題:一旦像蘋果這種系統(tǒng)級別的廠商跟進,打擊將是致命的。

03 鍵盤,會被取代到什么程度

回頭看這幾年自己折騰輸入工具的歷程,我越來越強烈地意識到一個事實:我們過去為鍵盤付出的那些努力,很大一部分是在幫一套并不那么「順手」的設(shè)計擦屁股。

QWERTY 布局本身并不是為了人體工學而生,它誕生于機械打字機時代,核心目的是降低卡紙、讓金屬字桿別那么容易打結(jié)。為了照顧機器,我們刻意犧牲了一部分人的效率,然后再用盲打訓練、打字課和大量練習,把這種妥協(xié)牢牢刻進自己的肌肉記憶里。

最開始的打字機并不是 QWERTY 布局。1873 年,美國人 Christopher Sholes,將常用的字母組合分開排列,降低打字速度,以解決因按鍵復(fù)位機制緩慢而導(dǎo)致的打字卡頓問題,最終形成了 QWERTY 布局|圖片來源:Wikipedia

機械鍵盤、分體式鍵盤、各種人體工學鍵盤,本質(zhì)上都還停留在這種框架之內(nèi):我們在既定的格子里,想辦法讓手指跑得沒那么累。

語音則完全是另外一條路。說話這件事,本來就是人類最自然的輸出方式之一。我們從小就學會用聲音組織情緒和思想,所有的停頓、轉(zhuǎn)折、插話、反悔,都是在這種流動里長出來的。

真正開始高頻用語音和 AI 交互之后,我才發(fā)現(xiàn),所謂「自然輸入方式」不只是速度快一點,而是它把我從很多不必要的負擔里解放了出來: 不用在意是不是每個字都敲對,不用提前把句子構(gòu)造好,不用為了照顧輸入法刻意改變自己的表達習慣。我可以像和人說話一樣把一件事情講清楚,剩下的交給模型去理解、去整理 。

Typeless 這一類軟件,站在這個趨勢上做了一步更激進的嘗試。它并不滿足于當一個「語音版鍵盤」,而是很明顯地在向系統(tǒng)級能力靠攏:在桌面端,它試圖成為一層獨立于具體 App 之上的輸入層;在 iOS 端,它干脆取消了鍵盤,把「說話」設(shè)定為默認動作。

在 iOS 端,Typeless 做得非常激進,直接取消了鍵盤輸入,僅保留語音輸入|圖片來源:極客公園

這種野心讓我看到了一些想象空間:如果有一天,操作系統(tǒng)層真的接受了「語音優(yōu)先」的前提,把類似 Typeless 的能力直接做進系統(tǒng),也許我們今天習慣的很多交互細節(jié)都會被改寫。

當然,這一切目前都還停留在可能性層面。大公司會不會愿意把這件事做到極致,用戶會不會接受一套以語音為主的新習慣,監(jiān)管和隱私會怎么演化,這些問題誰都說不準。

對我來說,唯一可以確認的,是它已經(jīng)在「輸入效率」這個非常具體的指標上,給出了一個足夠有說服力的答案: 在很多場景里,我可以用更短的時間,把更多的信息、更完整的語義輸入到電腦里,而且中間少了很多和鍵盤搏斗的環(huán)節(jié) 。

哪怕最終 Typeless 沒能長成一個真正的「系統(tǒng)級存在」,這部分被釋放出來的效率和注意力,大概也已經(jīng)足夠說明一件事——輸入方式這件事,我們完全有理由重新想象。

    熱門排行

    友情鏈接