ERLEDIGT
NEIN
NEIN
ANTWORTEN
0
0
ZUGRIFFE
1107
1107
EMPFEHLEN
-
Hallo,
ich hab ein Problem mit BeautifulSoup. Ich benutze es um eine Webseite nach bestimmten Tags zu durchsuchen. Das Problem ist, dass BeautifulSoup die Ergebnisse mit UTF-8-Kodierung zurück gibt. Wenn in dem Text jetzt aber beispielsweise Anführungszeichen ("") beinhaltet sind, werden die bei der Ausgabe so:dargestellt."
Wie kann ich das umgehen?
Hier der Code:
Code :1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
#encoding: utf-8 import feedparser from BeautifulSoup import BeautifulSoup import urllib2 news_rss_url = "http://www.n-tv.de/panorama/rss" info = feedparser.parse(news_rss_url) for entry in info.entries: link = entry.link+"?service=print" response = urllib2.urlopen(link) html = response.read() soup = BeautifulSoup(html) erg = soup.renderContents() #Überschrift (Sicherer entry.title aus RSS) #erg_ueber = soup.findAll({'h1' : True}) #ueber = erg_ueber[0].renderContents() print entry.title #Zusammenfassung (Sicherer entry.description aus RSS) #erg_zfassung = soup.findAll({'p' : True}) #zfassung = erg_zfassung[0].renderContents() print entry.description #Eigentliche News for node in soup.findAll('p'): print ''.join(node.findAll(text=True)) #DIESE AUSGABE ist nicht korrekt (oben kann ich es umgehen, da der feedparser es korrekt kodier zurückgibt) break print "\n"
Ähnliche Themen
-
Problem mit Zeichen-Kodierung
Von fsmarine im Forum JavaAntworten: 3Letzter Beitrag: 31.08.11, 18:25 -
Problem mit Cäsar Kodierung
Von Marimi im Forum C/C++Antworten: 1Letzter Beitrag: 10.11.10, 20:46 -
Problem potentiell Zeichen-Kodierung
Von takidoso im Forum JavaAntworten: 1Letzter Beitrag: 08.12.09, 14:31 -
Browser Problem und Text-Kodierung
Von pchilfe im Forum HTML & XHTMLAntworten: 2Letzter Beitrag: 27.09.07, 22:16 -
DPCM Kodierung
Von marrrc im Forum Audiotechnik, Recording & Audio-SoftwareAntworten: 0Letzter Beitrag: 23.06.05, 15:50





Zitieren
Login





