4: Perquè el català és una de les llengües del món amb més continguts a Internet #10raons

Compartir

El català és una de les llengües del món amb més continguts a Internet i prova d’això és que hi ha moltes pàgines web que o bé están escrites íntegrament en català o n’incorporen la traducció de forma clara. Precisament aquesta és la 4a de les #10raons amb que treballem en la campanya perquè els productes digitals parlin català.

Segons Jordi Mas autor de l’informe La salut del català a Internet, “determinar amb exactitud la presència d’una llengua a Internet és una tasca complexa i fora de l’abast dels mitjans tècnics i humans”.

De fet, tal com apunta en Jordi Mas “per analitzar i mesurar la presència del català a la web s’hauria de tenir en compte que Internet no és només la web, ja que hi ha multitud d’espais sensibles a les llengües, com ara el correu electrònic, els xats, els grups de discussió o la missatgeria instantània, que són difícils de mesurar, quan no impossibles, sense la col·laboració dels proveïdors d’accés a la Xarxa”.

De tota manera, podem estar satisfets perquè segons els darrers informes el català apareix com la 19a llengua en nombre de pàgines web per parlant, d’entre les 6.900 llengües que hi ha al món.

També cal tenir en compte que l’increment de pàgines web es deu en bona part a que els cercadors d’Internet actuals tenen més pàgines web indexades que fa pocs anys.

Com veieu, el català a Internet continua amb una forta posició respecte a altres llengües, i cal dir que la popularització dels blocs en llengua catalana també ha contribuït a generar un increment important del nombre de pàgines disponibles.

Per evitar suspicàcies, cal remarcar que per analitzar aquestes qüestions s’ha usat una metodologia concreta, seguint la base de dades del cercador Google. Amb la tècnica anomenada “complement del conjunt buit” basada en cercar paraules no existents en una llengua per a determinar el nombre de pàgines indexades. Amb aquesta tècnica s’ha intentat interrogar amb la màxima fiabilitat possible la quantitat de pàgines web que Google té indexades per a cada llengua.

I us preguntareu com determina Google la llengua d’una pàgina? Doncs el sistema utilitzat per aquesta multinacional es basa principalment en la freqüència d’aparició de determinats mots en les pàgines (term frequency). Com us podeu imaginar aquests sistemes no són del tot fiables, ja que en pàgines petites, o per a llengües properes (com pot ser l’occità), la detecció de la llengua pot ser incorrecta.

Malgrat tot, no patiu perquè mentre seguim parlant i sobretot escrivint en català a través de la Xarxa, segurament continuarem escalant posicions en aquests informes.

Podeu llegir la publicació sencera de la Direcció General de Política Lingüística en aquest enllaç.

4: Perquè el català és una de les llengües del món amb més continguts a Internet #10raons
Valoreu aquesta publicació

Etiquetes: