Dit is een topic in Community » Forum » Pro » Software-ontwikkeling

Brakke HTML parsen in Cocoa

Dr. Rengers

Dr. Rengers op 20 november 2009 #

Hallo, De laatste paar dagen ben ik bezig geweest met het schrijven van een iPhone app die mijn lesrooster kan parsen. Zo kan ik zelfs 's ochtends in bed nog ff snel kijken hoe laat ik ook alweer de trein moet pakken Als alternatief voor de NSXML classes maak ik gebruik van TouchXML Het parsen zelf is niet zo'n probleem, daar ben ik al grotendeels uit. Het probleem is alleen dat de parser niet echt blij is met de HTML source. In de console komen een hoop dingen voorbij waar hij over struikelt. Het hele log is hier te vinden: http://student.cmd.hro.nl/0806565/prive/log.txt De source staat hier: http://www.misc.hro.nl/roosterdienst/webroosters/Media%20CMD/kw2/47/c/c00017.htm Heeft iemand toevallig ervaring op dit gebied? Bedankt, Dr. Rengers

arri

arri op 20 november 2009 #

een xml parser verwacht natuurlijk xml als input. die rooster-pagina is geen geldige xml, zoals o.a. ook doc-type al aangeeft.

Sjakelien

Sjakelien op 20 november 2009 #

HTML is lastig. In een van mijn apps behandel ik html dan ook als gewone tekst, waar ik doorheen zoek. Mijn belangrijkste instrument daarbij is "componentsSeparatedByString:". Daarmee kun je opzoek gaan naar een bepaalde tag. Hak de rest dan weer op met de sluittag als Separator, en je hebt de inhoud van je tag. Ik hoop dat dit helpt.

loob op 20 november 2009 #

Kijk eens naar http://touchtank.wordpress.com/element-parser/ - heb er zelf geen ervaring mee, maar het ziet er veelbelovend uit...

Je kunt alleen reageren met een gratis OMT account.
Log in of registreer.

Inloggen

Over dit topic

Gestart op 20 november 2009 door Dr. Rengers

Laatste reactie door loob

Reageer op dit topic