In questi giorni, con il fatto che Apple ha iniziato a offrire la possibilità di preordinarlo, si è tornato a discutere di iPad in NewtonTalk, la mailing list dedicata al Newton (il PDA prodotto da Apple negli anni 1993–98). Qual è il senso di trattare iPad (e iPhone) in una lista incentrata sul Newton? In genere l’angolazione del dibattito prende come punto prospettico iPad come erede del Newton, e se ne analizzano le differenze, i vantaggi, e gli inconvenienti o gli aspetti di iPad che lasciano qualche dubbio all’utente Newton di lungo corso.
È piuttosto ovvio che il nocciolo della discussione riguardi le tecnologie di input. Per i newtonisti duri e puri, iPad non sarà mai un valido sostituto del loro MessagePad o eMate poiché privo di riconoscimento della scrittura. Steve Jobs non ha fatto mistero della sua antipatia nei confronti di penne e stili come strumenti di input, soprattutto nell’ormai storico keynote del 2007 in cui introdusse iPhone. Per i sostenitori della tecnologia di riconoscimento della scrittura implementata nel Newton, tagliarla fuori da iPhone OS è un’opportunità persa (e un peccato, visto gli anni di sviluppo che Apple ha dedicato a questa tecnologia) ma è anche, in un certo senso, un messaggio implicito che rafforza ulteriormente il ruolo della tastiera — virtuale o meno — come unica, sensata modalità di immissione di informazioni.
A questo punto, in genere, la discussione si polarizza: da un lato troviamo gli irriducibili newtonisti, ormai abituati alla comodità di poter scrivere sullo schermo del Newton come fosse un block notes e di avere la propria scrittura riconosciuta con un buon livello di velocità e precisione, che vedono iPad come un dispositivo dalle molte potenzialità ma handicappato dalla mancanza di quella tecnologia di input; dall’altro troviamo tutta una serie di utenti, magari già entusiasti possessori di iPhone/iPod touch, che vedono il meglio dei due mondi, che si sono abituati alla tastiera virtuale di iPhone, e per i quali la mancanza del riconoscimento della scrittura e del supporto dello stilo in iPad non è la fine del mondo.
Ultimamente la discussione si è lasciata un po’ alle spalle i dispositivi specifici per concentrarsi sulle sole tecnologie di input, e oltre alla scrittura e all’immissione mediante tastiera, è entrata in gioco un’altra tecnologia, il riconoscimento vocale. Ryan ne è il maggior entusiasta, e scrive:
La realtà dei fatti è che il mercato ha deciso che cosa preferisce. La maggioranza delle persone preferiscono una tastiera [rispetto alla scrittura con penna] e un numero sempre maggiore di persone utilizza tastiere virtuali su dispositivi come iPhone come sistema di input.
Il pen computing in generale è stato un fallimento sul mercato. Ha fallito nei dispositivi più piccoli come i PDA e nei dispositivi di dimensioni maggiori come i Tablet PC. È stato il mercato a deciderlo. La tecnologia di input mediante la penna ha avuto il suo momento, ma non ha mai veramente attecchito a causa delle sue inefficenze.
Diamo un’occhiata ad applicazioni pratiche. Sono in piedi sul treno: gente dappertutto, rumore, ecc. Posso fare una telefonata senza nemmeno toccare il mio iPhone grazie al suo Controllo Vocale, o grazie ad auricolari Bluetooth che attenuano il rumore di fondo. Posso creare un contatto con una mano sola, così come navigare il Web, leggere feed RSS, scrivere una nota veloce; tutto con una sola mano.
Con un dispositivo come il Newton non è proprio possibile. Ci vogliono due mani, è un dispositivo più ingombrante e quindi meno pratico in ambienti caotici e in cui si è costretti a stare in piedi.
Ovviamente quegli ambienti sono altrettanto poco adatti all’uso della tecnologia di riconoscimento vocale, che, come dite, funziona meglio in situazioni private e tranquille. […]
In ogni caso, il riconoscimento vocale ha davvero un futuro. Dottori, avvocati… nei loro ambienti è già ampiamente diffuso. E ora sempre più consumatori lo stanno scoprendo. Ovviamente si tratta di persone che si trovano in ambienti di lavoro adatti ad utilizzarlo: freelancer che lavorano da casa, per esempio. Ho recentemente tenuto un seminario sul riconoscimento vocale, indirizzato a traduttori, e per loro è una piccola rivoluzione. Sin da quando hanno iniziato a farne uso la loro produzione è aumentata, hanno meno dolori ai polsi perché scrivono meno, e la qualità dei lavori di traduzione eseguiti con l’aiuto del riconoscimento vocale è aumentata. Ora possono semplicemente dare un’occhiata a un breve paragrafo e pronunciarne la traduzione, così come verrebbe nella loro lingua. È un processo incredibilmente veloce e liberatorio. Quando guardiamo al lavoro che svolgono queste persone, faticando sulle loro tastiere battendo decine di migliaia di parole alla settimana, [il riconoscimento vocale] ha cambiato la loro vita. Possono persino stare in piedi e lontano dal computer se si servono di apparecchi wireless, e tradurre parlando. […]
Il riconoscimento vocale ha reso anche la mia vita più facile, dato che scrivo parecchie email durante il giorno. Il riconoscimento vocale ha aumentato la mia produttività in maniera significativa, e i miei polsi ne hanno beneficiato. Come tutti coloro che ne fanno uso, anch’io combino l’utilizzo di tastiera e riconoscimento vocale durante una giornata normale. Per le email più lunghe uso il riconoscimento vocale, e conosco molti altri che fanno lo stesso nei loro uffici. Dopo che l’email ‘dettata’ è finita, mi viene spontaneo sorridere perché so quanto più tempo avrei impiegato se l’avessi dattilografata. […]
Bene, come potete vedere c’è molto entusiasmo in questo intervento. Persino troppo per i miei gusti.
Per trattare del perché il pen computing non ha avuto il successo sperato ci vorrebbe un articolone a sé stante. Diciamo sinteticamente che è stato perseguito poco e male. Invece di concentrare le energie sul perfezionamento del riconoscimento della scrittura (e con il Newton si era davvero sulla buona strada, credetemi), si è voluto usare la combinazione touch-screen più penna in applicazioni e con interfacce completamente inadeguate, vedansi certi cellulari dei primi anni Duemila, con schermi piccoli e stilo grandi come stuzzicadenti. È un peccato, perché ritengo che la scrittura con la penna sia un metodo di input tuttora valido (se fosse ricercato e sviluppato adeguatamente) in quanto naturale per gli esseri umani. La riprova è nell’ambito grafico: qualsiasi professionista del settore vi dirà che non c’è niente di meglio che la penna e la tavoletta grafica per effettuare disegni, illustrazioni e affini.
Il riconoscimento vocale, per come la vedo io, ha ancora tantissima strada da fare, e non condivido tutta la sicurezza dimostrata da Ryan nel suo intervento appassionato. La prima cosa da migliorare è l’affidabilità e la precisione nel tradurre per iscritto quanto viene dettato. Forse l’entusiasmo di Ryan è dovuto al fatto che lui parla inglese, e probabilmente i software a disposizione oggi per un parlante inglese offrono risultati migliori rispetto ad altre lingue.
Ma i problemi del riconoscimento vocale non sono questi. Sono le applicazioni in concreto, l’uso sul campo. Come altri in lista hanno evidenziato, il riconoscimento vocale non è certo qualcosa usabile in pubblico, sia per l’ovvio impatto acustico, il caos che ne deriverebbe, per non parlare della maleducazione (che è già marcata per quanto riguarda l’abitudine di parlare ad alta voce al cellulare, imponendo i fatti propri e le proprie sciocchezze ai malcapitati che si trovano nei paraggi, figuriamoci se chiunque si porta appresso un computer sui mezzi pubblici si mettesse a dettare documenti ad alta voce), ma anche per un discorso di privacy dei dati. Esistono categorie professionali che hanno l’obbligo della confidenzialità nel trattare le informazioni dei propri clienti, e non possono certamente mettersi a parlare ai propri computer in pubblico. Per non parlare di segreti industriali e, in generale, di tutta una serie di informazioni che devono tassativamente rimanere protette da occhi (e orecchie) altrui.
Solo quest’unico aspetto della situazione limita drasticamente l’utilizzo del riconoscimento vocale. Ma anche nelle migliori condizioni d’uso, pur non negando una certa bellezza nel poter dettare un testo al computer e vedermelo riconosciuto sullo schermo, non posso non sottolineare un aspetto che Ryan, nella sua foga, sembra essersi dimenticato: che un testo dettato e riconosciuto è tutt’altro che ultimato. Quando scrive: Per le email più lunghe uso il riconoscimento vocale, e conosco molti altri che fanno lo stesso nei loro uffici. Dopo che l’email ‘dettata’ è finita, mi viene spontaneo sorridere perché so quanto più tempo avrei impiegato se l’avessi dattilografata, io dubito fortissimamente che, a dettatura ultimata, quell’email sia priva di errori tipografici e non necessiti di alcuna operazione di correzione o modifica. A meno che a Ryan non importi la qualità finale della sua scrittura. Il risparmio di tempo che lui avverte è, a mio modesto parere, più avvertito che reale. Non basta infatti che il computer riconosca il testo dettato e metta i punti fermi e le maiuscole dove servono. Il testo va poi adattato e corretto per far sì che sia a tutti gli effetti un testo scritto e non la trascrizione di un soliloquio.
Non è una prova difficile da fare, anche senza software di riconoscimento vocale: pensate a un’email o a un testo medio-breve che vorreste scrivere, e dettatelo a un registratore, poi trascrivete quel che avete detto così come lo sentite. Dovrete innanzitutto eliminare congiunzioni e pause ridondanti, poi, siccome non siamo robot, bisognerà aggiustare la sintassi e i collegamenti tra le frasi. Parlando è facile incappare in periodi sintatticamente sospesi, in anacoluti, in espressioni che si accettano nel discorso parlato ma che sono improprie in un testo scritto. Come vedete, non basta una trascrizione accurata, bisogna produrre un documento scritto in maniera consona. Con una tale operazione di ‘post-produzione’, se mi passate il termine, non vedo tutto questo guadagno di produttività, e non vedo nemmeno tutto il risparmio in dattilografia. Almeno, allo stato attuale della tecnologia di riconoscimento vocale. (A meno che non vogliamo finire con lo scrivere come parliamo, ché non mi pare una bella prospettiva: il mio idraulico utilizza un servizio di trascrizione dei messaggi che invia con il cellulare, così può dettare un SMS a voce e inviarlo senza usare le mani. Gli SMS che mi arrivano sono intelligibili, ma sintatticamente grezzi. Qui l’impiego del riconoscimento vocale ha senso, perché l’ambito è circoscritto e si privilegia il fine — il messaggio — al mezzo impiegato per scriverlo, ma rabbrividisco al pensiero di email o articoli scritti nella stessa maniera).
E infine, proprio per queste ragioni, fatico a credere che il riconoscimento vocale sia questa gran panacea per i traduttori freelance così come l’ha dipinta Ryan nella foga di esaltarne le virtù. Per il tipo di lavoro che faccio io ho bisogno di quiete e riflessione, e di lavorare ‘corpo a corpo’ sul testo che sto traducendo; non riuscirei affatto a mettermi a dettare traduzioni al volo, mi pare più un lavoro da interpreti, che sono abituati e addestrati a tradurre quasi istantaneamente, ma sempre in un ambito di discorso parlato.
A meno di non essere smentito da scoperte rivoluzionarie nel settore, ho davvero l’impressione che il riconoscimento vocale continuerà a funzionare solo in situazioni precise e circoscritte. È una tecnologia certamente utile (basti pensare al supporto preziosissimo che offre ai disabili), ma a mio avviso passerà ancora diverso tempo prima che possa estendersi e penetrare nei variegati aspetti della quotidianità e prima che possa (se mai accadrà) sostituire completamente la tastiera come metodo di input.
3 Comments