<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta content="text/html;charset=UTF-8" http-equiv="Content-Type"></head><body ><div style="font-family: Verdana, Arial, Helvetica, sans-serif; font-size: 10pt;"><div><br></div><div>Hey!<br></div><div><br></div><div><br></div><div>This appears to work now, <br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>ping: zero elements.  Time: 0:00:00:10.941282<br></div><div>8717587920<br></div><div>ping: one hundred thousand elements.  Time: 0:00:00:21.888107<br></div><div>8787084464<br></div></blockquote><br>this is on StandardFileStream...<br><br><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>|ios|<br></div><div>Transcript clear.<br></div><div>ios := (StandardFileStream readOnlyFileNamed:('/bulkstorage/enwiki-20200501-pages-articles-multistream.xml' )).<br></div><div>[(DocDemoSaxHandler on:ios) pingevery:100000;  optimizeForLargeDocuments;parseDocument] forkAt: Processor userBackgroundPriority named:'SAX'<br></div></blockquote><br>those are lightening fast.<br><br>gonna run the full thing now.<br><br>cheers.<br><br><br></div><div class="zmail_extra_hr" style="border-top: 1px solid rgb(204, 204, 204); height: 0px; margin-top: 10px; margin-bottom: 10px; line-height: 0px;"><br></div><div class="zmail_extra" data-zbluepencil-ignore="true"><br><div id="Zm-_Id_-Sgn1">---- On Thu, 21 Oct 2021 13:46:52 -0400 <b>gettimothy via Squeak-dev <squeak-dev@lists.squeakfoundation.org></b> wrote ----<br></div><br><blockquote style="margin: 0px;"><div><div style="font-family :  Verdana,  Arial,  Helvetica,  sans-serif; font-size :  10pt;"><div><br></div><div>Also...<br></div><div><br></div><div>Those snippets are modelled on stuff from  the SAXHandler class comment.<br></div><div><br></div><div>I recall trying to create a ReadStream on the file, but I kept getting those FS errors...maybe I should retry?<br></div><div><br></div><div><br></div><div><br></div><div class="x_-182135212zmail_extra_hr" style="border-top :  1px solid rgb(204, 204, 204); min-height:  0px; margin-top :  10px; margin-bottom :  10px; line-height :  0px;"><br></div><div class="x_-182135212zmail_extra"><br><div id="x_-182135212Zm-_Id_-Sgn1">---- On Thu, 21 Oct 2021 13:13:44 -0400 <b>Levente Uzonyi <<a href="mailto:leves@caesar.elte.hu" target="_blank">leves@caesar.elte.hu</a>></b> wrote ----<br></div><br><blockquote style="margin :  0px;"><div>Hi Tim, <br> <br>On Thu, 21 Oct 2021, gettimothy wrote: <br> <br>> Thx Levente. <br>> <br>> <br>> Should I attempt to fix this? How should it be approached? <br>> <br>> I have only a dim idea what "read buffering is" (file access is slow, so get a lot of data, at a certain threshold, asynchonously refill the buffer?). <br>> <br>> Is there an existing Stream that implemts it? <br>> <br>> Should I take the guts of that and put it in FSReadStream?  <br> <br>What is the snippet you execute to parse the documents? <br> <br>(I loaded Monty's XML parser and checking the code makes me think <br>that you create an FSReadStream not Monty's code). <br> <br> <br>Levente</div></blockquote></div><div><br></div></div><br></div><br></blockquote></div><div><br></div></div><br></body></html>