Reader in Safari 5, hoe werkt het?
Synapse88 op 18 juni 2010 #
Hoi,
Ik ben grote fan van de Reader functie in Safari 5 maar vraag me af hoe het nu detecteert of er een artikel aanwezig is op de pagina of niet. Gaat dit aan de hand van bepaalde html-css combinaties? Of de html5 article tag?
Ik kan niet echt een duidelijke verklaring vinden.
Synapse88 op 18 juni 2010 #
Zou kunnen maar op deze pagina zou dan Reader beschikbaar moeten zijn en dat is niet het geval
http://deredactie.be/cm/vrtnieuws/verkiezingen2010/100618_rompuy_waarschuwing
Jakko Westerbeke op 18 juni 2010 #
Niet met RSS — zoals al gezegd zouden sommige sites dan de reader moeten laten zien, en ik zie toch echt soms "reader" en soms "rss" in de adresbalk staan.
Er zal wel een stukje kunstmatige intelligentie achter zitten, maar ik vraag me ook af hoe het ongeveer werkt. Het (b)lijkt in elk geval gebaseerd te zijn op Readability.
Synapse88 op 18 juni 2010 #
Leuk om weten waar het mee gemaakt is. Spijtig genoeg maakt dat nog niet duidelijk hoe Safari kiest waar wel en waar niet.
Oppie op 18 juni 2010 #
Rickje - op 18 juni 2010Op basis van RSS?
RSS Artikel = JA? -> READER
= NEE -> GEEN READER
Zo Rickje, als je zulke vette kapitalen gebruikt moet je het wel heel zeker weten... Vertel!
Jakko Westerbeke op 19 juni 2010 #
bob van der vleuten - op 18 juni 2010Leuk om weten waar het mee gemaakt is. Spijtig genoeg maakt dat nog niet duidelijk hoe Safari kiest waar wel en waar niet.
Dus onderzoeken we verder
De Readability-knop op de site, die je naar de knoppenbalk van je browser moet slepen, voert deze code uit als je erop klikt:javascript:(function(){readStyle='style-newspaper';readSize='size-medium';readMargin='margin-wide';_readability_script=document.createElement('SCRIPT');_readability_script.type='text/javascript';_readability_script.src='http://lab.arc90.com/experiments/readability/js/readability.js?x='+(Math.random());document.getElementsByTagName('head')[0].appendChild(_readability_script);_readability_css=document.createElement('LINK');_readability_css.rel='stylesheet';_readability_css.href='http://lab.arc90.com/experiments/readability/css/readability.css';_readability_css.type='text/css';_readability_css.media='all';document.getElementsByTagName('head')[0].appendChild(_readability_css);_readability_print_css=document.createElement('LINK');_readability_print_css.rel='stylesheet';_readability_print_css.href='http://lab.arc90.com/experiments/readability/css/readability-print.css';_readability_print_css.media='print';_readability_print_css.type='text/css';document.getElementsByTagName('head')[0].appendChild(_readability_print_css);})();
En als je goed kijkt, zie je dat er onder andere dit stuk JavaScript aangeroepen wordt: http://lab.arc90.com/experiments/readability/js/readability.js. Daarin valt dan weer deze samenvatting (in mensentaal) te lezen:
* 1. Prep the document by removing script tags, css, etc.
* 2. Build readability's DOM tree.
* 3. Grab the article content from the current dom tree.
* 4. Replace the current DOM tree with the new one.
* 5. Read peacefully.
Snel kijkende door het script komt het er volgens mij op neer dat het de pagina analyseert en dan probeert zo goed mogelijk te gokken wat de echte inhoud is:
Using a variety of metrics (content score, classname, element types), find the content that is most likely to be the stuff a user wants to read. Then return it wrapped up in a div.
Zoek in het script maar op "grabArticle" dan kom je vanzelf het stuk code tegen dat deze analyse uitvoert.
Advertentie
Je kunt alleen reageren met een gratis OMT account.
Log in of registreer.
Inloggen
Over dit topic
Gestart op 18 juni 2010 door Synapse88
Laatste reactie door Synapse88