<div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><br>
Beautiful Soup is a python HTML parser for malformed HTML:<br>
<a href="http://www.crummy.com/software/BeautifulSoup/" target="_blank">http://www.crummy.com/<u></u>software/BeautifulSoup/</a><br>
<br>
The Smalltalk port is here:<br>
<a href="http://www.squeaksource.com/Soup.html" target="_blank">http://www.squeaksource.com/<u></u>Soup.html</a></blockquote><div><br></div><div>I didn&#39;t know about that. I took the approach of using the browser&#39;s html parser and walking the DOM in javascript to provide the translation. That way the browser handles any malformed html, but the down-side is the parser is written in javascript not Smalltalk...</div>
</div>