Brakke HTML parsen in Cocoa
Dr. Rengers op 20 november 2009 #
Hallo,
De laatste paar dagen ben ik bezig geweest met het schrijven van een iPhone app die mijn lesrooster kan parsen. Zo kan ik zelfs 's ochtends in bed nog ff snel kijken hoe laat ik ook alweer de trein moet pakken
Als alternatief voor de NSXML classes maak ik gebruik van TouchXML
Het parsen zelf is niet zo'n probleem, daar ben ik al grotendeels uit. Het probleem is alleen dat de parser niet echt blij is met de HTML source. In de console komen een hoop dingen voorbij waar hij over struikelt.
Het hele log is hier te vinden: http://student.cmd.hro.nl/0806565/prive/log.txt
De source staat hier: http://www.misc.hro.nl/roosterdienst/webroosters/Media%20CMD/kw2/47/c/c00017.htm
Heeft iemand toevallig ervaring op dit gebied?
Bedankt,
Dr. Rengers
arri op 20 november 2009 #
een xml parser verwacht natuurlijk xml als input. die rooster-pagina is geen geldige xml, zoals o.a. ook doc-type al aangeeft.
Sjakelien op 20 november 2009 #
HTML is lastig. In een van mijn apps behandel ik html dan ook als gewone tekst, waar ik doorheen zoek. Mijn belangrijkste instrument daarbij is "componentsSeparatedByString:". Daarmee kun je opzoek gaan naar een bepaalde tag. Hak de rest dan weer op met de sluittag als Separator, en je hebt de inhoud van je tag. Ik hoop dat dit helpt.
loob op 20 november 2009 #
Kijk eens naar http://touchtank.wordpress.com/element-parser/ - heb er zelf geen ervaring mee, maar het ziet er veelbelovend uit...
Advertentie
Je kunt alleen reageren met een gratis OMT account.
Log in of registreer.
Inloggen
Over dit topic
Gestart op 20 november 2009 door Dr. Rengers
Laatste reactie door loob
Reageer op dit topic