25. juni 2009

Google Translate på tværs af sproggrænser

I disse tider hvor der sket meget i Iran, har Google Translate føjet farsi (persisk) til sit repertoire. Normalt føjer jeg bare til i listen, men denne gang har det særlig interesse på grund af den højspændte situation. Jeg har læst at blogging, Facebook og andet spiller en stigende rolle i landet og at præstestyret er ude på at kontrollere internettet. Men se det endsige søge i det har været umuligt.
Bemærk at du ikke kan vælge persisk i den danske udgave af Google Oversæt. Du skal tvinge den over i den engelske (udskift fx da med eng i adresselinjen). Så er det bare med at finde det rigtige at søge på. Jeg prøvede med lidt forskellige. Election fraud eller bare elections eller election gav en hel del.
At det er en helt anden verden vi her dykker ned i, fremgår bl.a. af at når du skal kontrollere aktualiteten, skal du kende den rigtige kalender. Jeg så fx indslag fra juni 1388, og troede at det var en islamiske kalender som så bare skulle konverteres til den vestlige gregorianske kalder. Men her fandt jeg ud af at 2009 svarer til år 1430. (Jeg brugte islamonline.). Iran har en anden kalender, og en sådan fandt jeg ved at søge på iranian calendar converter. Så blev jeg så meget klogere.
Hvis du gerne vil søge på weblogs eller nyheder er det lidt mere tricky. Men du kan gøre følgende: oversæt et ord, og kopier den persiske oversættelse over i søgefeltet på Google News eller Google Blogsearch. Søg herefter. Resultatet er selvfølgelig komplet uforståeligt, hvis du ikke forstår persisk. Google Blogsearch vil automatisk lave et link til at oversætte. Og bare ved at søge på den persiske oversættelse af elections er en oplevelse i sig selv. Prøv.

Ovenov er er et af indslagene oversat fra persisk til dansk. Originaludgaven er skrevet på farsi og jeg forstod intet af det. Med oversættelsen sammen med billedet kan jeg nogenlunde gætte mig til hvad artiklen går ud på.
Du kan tage tekst eller urladresse til Google Translate og bruge det til at oversætte, helst til engelsk. Dette er dog stadig kun i Alfa-udgave, og du skal søge længe for at få et acceptabelt resultat.
Google Translate har virkelig åbnet op for helt uanede muligheder for informationsformidling på tværs af sprog. Godt nok er oversættelserne ikke perfekte, men de giver et enestående indblik i en for os meget fremmed verden, selv med de enkelte forståelige tekster.
Link
Google oversæt.
Googleblog.

23. juni 2009

Ask - som du spørger får du svar

Ask oplyste for nylig i sin weblog at de nu er oppe på at have registreret 300 mio. spørgsmål og svar i deres database. Det er lang tid siden jeg har brugt Ask. Jeg foretrækker de mere lige til Answers.com eller Wikipedia for hurtige opslag. Men Ask har jo slået sig op på netop at skulle kunne give svar på alle spørgsmål i sted med What is, who is osv.
Når nu mange af spørgsmålene netop besvares fra Wikipedia, Answers, Yahoo Answers mm. kunne man jo også spørge sig selv om hvorfor netop bruge Ask. Men jeg kan godt se fidusen ud fra to argumenter. Det ene er at Ask kan fungere som en slags metasøgemaskine, det andet at man kan bruge mere dagligdagssætninger.
Så jeg prøvede sådan lidt tilfældigt med spørgsmål som disse:
Why do chickens have feathers ledte mig over i Why do birds have feathers. Hvilket jo egentligt ikke er så tosset. Med mindre jeg altså var interesseret i hvorfor lige præcis høns har fjer. Her var jeg ikke helt sikker på kilden. Men den ledte faktisk til en artikel som så rimelig ud, lidt populærvidenskabelig, men alligevel.
Så jeg fik lidt blod på tanden og forsøgte med et mere trickagtigt spørgsmål som Do Danish speak Swedish, uden at forvente et svar. Men det fik jeg fra Yahoo Answers med Do danish people really understand Swedish and Norwegian. Nu kan man altid diskutere hvor pålidelig Yahoo Answers er. Men set ud fra spørgsmålet, vil jeg godt godkende svaret.
Jeg er nu ikke helt sikker på at jeg vil svigte spørgsmålsbaser som Answers.com, Yahoo Answers og de forskellige landeudgaver af Wikipedia. Men for andre vil Ask måske være et alternativ til en slags metasøgemaskine til alle disse svartjenester. Spørgsmålet er igen om hvilken man foretrækker. Jo flere det er, jo flere er jeg i hvert fald tilbøjelig til at glemme.
Link
Ask Blog.

Ask - som du spørger får du svar

Ask oplyste for nylig i sin weblog at de nu er oppe på at have registreret 300 mio. spørgsmål og svar i deres database. Det er lang tid siden jeg har brugt Ask. Jeg foretrækker de mere lige til Answers.com eller Wikipedia for hurtige opslag. Men Ask har jo slået sig op på netop at skulle kunne give svar på alle spørgsmål i sted med What is, who is osv.
Når nu mange af spørgsmålene netop besvares fra Wikipedia, Answers, Yahoo Answers mm. kunne man jo også spørge sig selv om hvorfor netop bruge Ask. Men jeg kan godt se fidusen ud fra to argumenter. Det ene er at Ask kan fungere som en slags metasøgemaskine, det andet at man kan bruge mere dagligdagssætninger.
Så jeg prøvede sådan lidt tilfældigt med spørgsmål som disse:
Why do chickens have feathers ledte mig over i Why do birds have feathers. Hvilket jo egentligt ikke er så tosset. Med mindre jeg altså var interesseret i hvorfor lige præcis høns har fjer. Her var jeg ikke helt sikker på kilden. Men den ledte faktisk til en artikel som så rimelig ud, lidt populærvidenskabelig, men alligevel.
Så jeg fik lidt blod på tanden og forsøgte med et mere trickagtigt spørgsmål som Do Danish speak Swedish, uden at forvente et svar. Men det fik jeg fra Yahoo Answers med Do danish people really understand Swedish and Norwegian. Nu kan man altid diskutere hvor pålidelig Yahoo Answers er. Men set ud fra spørgsmålet, vil jeg godt godkende svaret.

Jeg er nnu ikke helt sikker på at jeg vil svigte spørgsmålsbaser som Answers.com, Yahoo Answers og de forskellige landeudgaver af Wikipedia. Men for andre vil Ask måske være et alternativ til en slags metasøgemaskine til alle disse svartjenester. Spørgsmålet er igen om hvilken man foretrækker. Jo flere det er, jo flere er jeg i hvert fald tilbøjelig til at glemme.

Link

22. juni 2009

Blogger 10 år

Som læserne vil bemærke, er der et indslag på engelsk herunder. Det er ikke fordi jeg er begyndt at udgive webloggen på et andet sprog. Men Blogger har i anledning af sin 10 års fødselsdag opfordret webloggere til at fortælle om deres oplevelser.
På godt og ondt har blogging været en del af mit privat- og arbejdsliv i 8 år. Så jeg har undtagelsesvist valgt at lave et privat (og ikke som sædvanligt, personligt), indslag, oven i købet på engelsk. Der skal være et link til indslaget, og i Blogger Buzz kan man se om historierne bliver offentliggjort. Jeg kan dog ikke se nogen i skrivende stund.
Link
Googleblog.

Internetsøgning/Blogger 8/10

Dear readers. This post is in English, because I wished to share my experiences with my weblog. Blogger is about to be 10 years. Ibeen with Blogger 8 of these years. Blogger wants stories about how weblogs changed your life. I want to share my thoughts.
Headlines are: I became author because of Blogger. And author of a webguide, Google-Guide on the website of Copenhagen Library.
Internetsøgning started in August 2002. Blogs were new in Denmark, I believe we were less that 100 bloggers. All in all. I had no idea of what a weblog was, just wanted to check it out. To tell the truth, I thought it was a waste of time. I was right: I got stuck, and keep on blogging.
In February 2004, I wrote about Nancy Blachman's Googleguide. 2 days later, she emailed me and asked for a translation of the 'Swedish' text ( Nancy didn't knew the difference between Danish and Swedish, she's long forgiven!). In short, she asked why I didn't translate the full Googleguide into Danish, which I did.
To my surprise, the site became very popular. At a time, it was the third most visited subpage of the libraries (not sure if it still is).
So it was almost inevitable that someone suggest making a book out of it. Which I did, in August 2005, Alt om Google. Sales went well, and in 2007, I did a second edition, Find det med Google. It has been translated into Norwegian, and probably into Swedish soon.
All this because of 5 lines on a weblog. So, blogging changed my life.

13. juni 2009

Persondata på internettet

Internettet myldrer med informationer. Dagligt udveksles der et mylder. Også med forskellig tilgængelighed. Det kan være alt fra private emailkonti, over Facebook til offentlige sider. Mange steder efterlader du endog oplysninger om dig selv. Og hvem har egentlig retten til disse oplysninger?
Normalt tænker du vel ikke over det når du bruger internettet. Måske opfatter du det som passivt brug. Men hvis du fx har oprettet en konto på fx Facebook, er dine personlige data ikke længere private i den forstand at Facebook kan udveksle dine oplysninger med en tredje part. Men det gælder også de mere gedulgte oplysninger som du automatisk efterlader når du benytter en hjemmeside.
I henhold til europæisk persondatalovgivning ejer du faktisk ikke selv dine personlige data som CPR-nummer, adresse, telefonnummer, og de data, som skaber en profil på internettet, når man besøger forskellige websites. USA har slet ikke nogen samlet persondatalov, som fx i Danmark. Groft sagt betyder det at i USA er personlige oplysninger noget som kan købes og sælges. Forskellen mellem Europa og USA er at samlinger af data i databaser kan være ophavsretligt beskyttet af nogle særlige regler i ophavsretsloven.
Facebook mente i første omgang at den kunne nøjes med en generel tilladelse fra brugerne. Men den går måske ikke. Der skal søges tiladelse i hver enkelt tilfælde. Grunden til at mange brugere alligevel accepterede det er, at det hurtigt ville gøre Facebook helt ubrugelig, og nok afholde mange brugere fra at bruge Facebook.
Situationen er langt fra afklaret. Det er en løbende balance som går ud på at de sociale netværkstjenester reelt bliver ubrugelige hvis lovgivningen skal overholdes og at brugerne i praksis accepterer at neglicere deres rettigheder da dette ville umuliggøre deres anvendelse af dem. Mellem disse yderpoler ligger så en række kompromisser hvor brugerne slækker på deres retlige krav og tjenesterne underkaster sig restriktioner i forhold til deres oprindelige udgangspunkt.

Link
Persondataloven.

10. juni 2009

Google Squared

Google Squared er et nyt tiltag fra Google som skal bidrage til at gå mere i dybden med besvarelser af spørgsmål. Altså der hvor du skal bruge 10-20 gode websteder i stedet for det ene hurtige svar. (Dette vil som regel være fra Wikipedia).
Google Squared er stadig på eksperimentalstadie i Google Labs og er beregnet til at løse den slags opgaver. Det sker ved at organisere informationer og præsentere dem i et regneark. Googleblog giver et eksempel med roller coasters (se link nedenfor). Altså en slags systematisering af oplysninger. Googleblog siger også at Sqared kun er det første skridt på vejen, så vi kan altså forvente mere. Og webloggen indrømmer også at det stadig er meget ufærdigt.
Google Blogoscoped har moret sig med at finde huller, og bl.a. fundet ud af at Squared erklærer kendte personer for døde. Men generelt er blogverdenen tilfreds med det.
Du kan jo selv afprøve den. Husk at logge på din konto. Det foregår ved at du prøver at forestille dig et spørgsmål hvor du vil have en række facts om et bestemt emne. Du kan herefter arbejde i regnearket ved at klikke på bestemte celler. Du kan gemme regnearket når du er tilfreds med det. Og så det sædvanlige med at dele det med andre på forskellige offentlighedsniveauer.
Jeg prøvede først med nogle danske søgninger uden at have de store forventninger. Og det lykkedes da heller ikke at finde noget der er værd at vise. Ingen af dem gav et umiddelbart resultat, men jeg kunne så tilføre nye ord. Hvilket heller ikke gav særlig meget. Det kan så skyldes at jeg er for fantasiløs eller at Squared bare ikke er så god til danske søgninger.
Det engelske går det lidt bedre med. Jeg kiggede ud af vinduet og fik øje på en gråspurv. Så sparrows blev det eksempel der faldt mig ind. Hvad skal jeg mene om det? Jeg synes at ideen måske nok skulle udvikles lidt mere. Jeg kan ikke umiddelbart se noget brugbart i dens nuværende form. Men mon ikke det bliver bedre med tiden? Vi kan da altid håbe.
Google har altid haft det problem at hvis du ikke finder noget med første hug, er der ikke nogen muligheder for at arbejde videre med søgningen. Exalead har i sådanne tilfælde noget, og ofte bruger jeg Exalead til at blive inspireret til yderligere afgrænsninger i Google. For Exalead har slet ikke Googles evne til at sortere de bedste øverst. Men det ville jo være rart ikke at skulle omkring Exalead først. Om Squared så løser det problem, vil tiden vise.
Link
Google Blogoscoped.
Google Blogoscoped.
Googleblog.

9. juni 2009

Maskinoversættelser

Google Translate er et af de førende maskinoversættelsesprogrammer. Jeg har tidligere omtalt dette på webloggen. Men der er også andre som arbejder med dette universelle problem. En af dem er sprogforsker Eckhard Bick. Alle har vel erfaringer for at komme hjem med et enestående produkt hvor den danske brugsanvisning er håbløst oversat, og hvor du med et vist kendskab til engelsk kan gætte dig til hvad meningen er.
Kontekstoversættelser er næsten umuligt er lave maskinelt, selv om Google er ganske god til det. Men om det nogensinde vil lykkes til fulde, er et stort spørgsmål. Google vil næppe få konkurrence fra ret mange andre firmaer. Deres oversættelser er nemlig baseret på statistik, hvor mængden er helt afgørende. Det er bl.a. mængden af dokumenter, mængden af søgninger og mængden af respons fra brugerne. På ingen af disse tre punkter er der nogen som i dag er i stand til at nå op på samme niveau.
Dog har Google Oversæt den store bagdel på mange 'små' sprog at den går omvejen over engelsk, og dermed tabes en del undervejs.
Det er da også på et andet felt at forskningslektor Bick fra Institut for Sprog og Kommunikation på Syddansk Universitet arbejder. Hans firma GrammarSoft har eksisteret (ifølge egen hjemmeside) siden 1999, og har arbejdet på et oversættelsesprogram som baserer sig på regler. Han har lavet analyser af dansk grammatik og sprogbrug, og indbygget det i sit program.
Der ligger nogle demoer på hjemmesiden for firmaet. Selve ideen i demoerne ser meget god ud. Men desværre synes jeg nu ikke at slutproduktet virker særligt lovende. Måske fordi det stadig er i beta? Men det er da måske værd at holde øje med. Google Oversæt til/fra dansk er nok stadig det bedste bud på en effektiv oversætter, og også stadig den mest præcise. Uden at være det perfekte.
Link
Videnskab.dk

4. juni 2009

Nordiske forlæggere om Google Settlement

De fem nordiske forlæggerforeninger fra Danmark, Norge, Sverige, Island og Finland udsendte den 27. maj en udtalelse om Google Settlement. Altså det forlig som Google har indgået om at udbetale beløb til ophavsretindehavere til indskannede bøger i Google Books.
Udtalelelsen tager udgangspunkt i europæisk ophavsretlovgivning om at indehaveren af ophavsret skal give tilladelse, og afviser blankt at Google Settlement opfylder dette krav. De kræver derfor at Google indskrænker sin virksomhed til kun at omfatte USA. De mener desuden at vide at Google er ved at udvikle sig til et monopol i strid med USA's antitrustlovgivning.
Udtalelsen rummer slet skjulte angreb på Google med vendinger som at tage loven i egen hånd, at aftalen er Catch 22 og bruger udtryk som 'sudden flux of books available'. Ikke overraskende afslutter de udtalelsen med at de protesterer imod Google Settlement og kalder den i modstrid med nordisk litteratur, idet de ikke mener at Google skal bestemme om nordisk litteratur skal distribueres digitalt i USA, men forfatterne og forlæggerne.
Jeg ved ikke. På den ene side kan jeg godt se at der er ophavsretsproblemer. Men på den anden side kunne man jo indvende at dette ikke er noget nyt: Europeana og europæerne har i længere tid end Google Books har eksisteret snakket om at digitalisere. Der er postet millioner, hvis ikke millarder af kroner i udredningsarbejde uden at det har kastet ret meget digitalisereret materiale af sig. Lovgivningen er heller ikke blevet tilrette den nye teknologiske tidsalder.
Så alt i alt virker det for udenforstående som en tilbagelænet fornærmet holdning fra forlagsverdenen om at de vil have lov til at have forfatterne i fred. Bemærk at Google ikke tjener penge på dette foretagende, men tværtimod har udgifter med det. Desuden har de formået at indskanne millioner af bøger allerede, hvor europæerne stadig tæller i få tusinder.
Musikbranchen i er øjeblikket i krise. GUF og andre forretninger lukker fordi musikkøbere har fundet andre veje. Tiden forandrer sig, og forlagene er selvfølgelig bange for at miste omsætning.
Historikere og bogelskere plejer at lovprise oldtidens bibliotek i Aleksandria for at samle den tids litteratur (selv om skibskaptajnerne rasede over at skulle vente på at skriverne afskrev deres materialer). Dengang skulle man rejse til Aleksandria for at læse dem. I dag har vi for første gang muligheden for digital adgang fra alverdens computere. Men vi kan ikke få lov til at se det. Vi kan ikke engang få lov til at søge i materiale.
Link
Artikel i Internetsøgning.