<br><br><div class="gmail_quote">On Wed, Aug 18, 2010 at 5:55 PM, Andrei Stebakov <span dir="ltr">&lt;<a href="mailto:lispercat@gmail.com">lispercat@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
I tried to load Scamper&#39;s Network-HTML, I got a Syntax Error during reloading:<br>
HtmlTokenizer private-initialization initialize:<br>
initialize: s<br>
        text _ s withSqueakLineEndings.<br>
        pos _ Nothing more expected -&gt;1.<br>
        textAreaLevel _ 0.<br>
<div class="im"><br></div></blockquote><div><br>That code is using underscore as assigment, don&#39;t allowed anymore in Pharo 1.1 unless you explicity set a specific setting. <br><br>So....or set that setting or update the code (in another image)<br>
<br>cheers<br><br>mariano<br><br> </div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div class="im">
On Wed, Aug 18, 2010 at 2:34 AM, laurent laffont<br>
&lt;<a href="mailto:laurent.laffont@gmail.com">laurent.laffont@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;<br>
</div><div><div></div><div class="h5">&gt; On Wed, Aug 18, 2010 at 7:50 AM, Andrei Stebakov &lt;<a href="mailto:lispercat@gmail.com">lispercat@gmail.com</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; I&#39;ve been looking for a nice and fast HTML parser.<br>
&gt;&gt; I&#39;ve found Zulq Alam&#39;s Soup<br>
&gt;&gt; (<a href="http://www.squeaksource.com/@vHckXt8_6gVtXFxy/XMrjDbIs" target="_blank">http://www.squeaksource.com/@vHckXt8_6gVtXFxy/XMrjDbIs</a>) it looks nice<br>
&gt;&gt; but it&#39;s way too slow for me (takes 5 sec to parse the page, my<br>
&gt;&gt; current lisp parser takes about 1 sec for that.)<br>
&gt;&gt; I found another one, Todd Blanchard&#39;s HTML and CSS parser<br>
&gt;&gt; (<a href="http://www.squeaksource.com/@iMgHmTKVxU00wEdz/A0jkqk71" target="_blank">http://www.squeaksource.com/@iMgHmTKVxU00wEdz/A0jkqk71</a>) but I<br>
&gt;&gt; couldn&#39;t load it into Pharo 1.1 or Squeak 4.1.<br>
&gt;&gt; It complains about some syntax error and leaves the progress bar which<br>
&gt;&gt; I can&#39;t kill...<br>
&gt;&gt; I wonder if anyone (Todd?) can take a look at the parser and figure<br>
&gt;&gt; out how to fix it?<br>
&gt;&gt;<br>
&gt;&gt; What other options I have for an HTML parser?<br>
&gt;&gt; Looking at Pharo speed I wonder if there is any way to optimize it? Is<br>
&gt;&gt; JIT or some other speed optimization in plans for Pharo/Squeak?<br>
&gt;<br>
&gt;<br>
&gt; What do you need to do ?<br>
&gt; There&#39;s XMLSupport <a href="http://www.squeaksource.com/XMLSupport.html" target="_blank">http://www.squeaksource.com/XMLSupport.html</a><br>
&gt; Scamper might have a standalone HTML<br>
&gt; parser <a href="http://www.squeaksource.com/Scamper.html" target="_blank">http://www.squeaksource.com/Scamper.html</a><br>
&gt; The CogVM has JIT.<br>
&gt; Laurent.<br>
&gt;<br>
&gt;&gt;<br>
&gt;&gt; Thank you,<br>
&gt;&gt; Andrei<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; Pharo-project mailing list<br>
&gt;&gt; <a href="mailto:Pharo-project@lists.gforge.inria.fr">Pharo-project@lists.gforge.inria.fr</a><br>
&gt;&gt; <a href="http://lists.gforge.inria.fr/cgi-bin/mailman/listinfo/pharo-project" target="_blank">http://lists.gforge.inria.fr/cgi-bin/mailman/listinfo/pharo-project</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
<br>
</div></div></blockquote></div><br>