<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta content="text/html;charset=UTF-8" http-equiv="Content-Type"></head><body ><div style="font-family: Verdana, Arial, Helvetica, sans-serif; font-size: 10pt;"><div><br></div><div>Hi Levente.<br></div><div><br></div><div>On squeak, here are two versions:<br></div><div><br></div><div><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>#timeProfile is your friend.<br></div><div>Transcript clear.<br></div><div>[(DocDemoSaxHandler on:('/bulkstorage/enwiki-20200501-pages-articles-multistream.xml' asFileReference)) pingevery:100000;  optimizeForLargeDocuments;parseDocument] timeProfile .<br></div><div><br></div><div>Transcript clear.<br></div><div>[(DocDemoSaxHandler on:('/bulkstorage/enwiki-20200501-pages-articles-multistream.xml' asFileReference)) pingevery:100000;  optimizeForLargeDocuments;parseDocument] forkAt: Processor userSchedulingPriority named:'SAX'<br></div></blockquote><br><br>the method #asFileReference does not exist on String in Squeak6.0alpha, I added that to  String in the fs-core-converting category, it is just a copy of String>>asReference from that same category;<br><br><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>asFileReference<br></div><div>"Return an FSReference on disk"<br></div><div>^ FileSystem disk referenceTo: self<br></div></blockquote><br><br>On pharo...same thing but without the asFileReference hack.<br><br><br><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>Transcript clear.<br></div><div>[(DocDemoSaxHandler on:('/bulkstorage/enwiki-20200501-pages-articles-multistream.xml' asFileReference)) pingevery:100000;  optimizeForLargeDocuments;parseDocument] forkAt: Processor userSchedulingPriority named:'SAX'<br></div><div><br></div><div><br></div><div>Transcript clear.<br></div><div>[(DocDemoSaxHandler on:('/bulkstorage/enwiki-20200501-pages-articles-multistream.xml' asFileReference)) pingevery:100000;  optimizeForLargeDocuments;parseDocument] timeProfile.<br></div></blockquote><br>thanks for your help.<br><br>t<br><br><br>also, those "ping"messages are some plumbing I added to my DocDemoSaxHandler class <br><br></div><div class="zmail_extra_hr" style="border-top: 1px solid rgb(204, 204, 204); height: 0px; margin-top: 10px; margin-bottom: 10px; line-height: 0px;"><br></div><div class="zmail_extra" data-zbluepencil-ignore="true"><br><div id="Zm-_Id_-Sgn1">---- On Thu, 21 Oct 2021 13:13:44 -0400 <b>Levente Uzonyi <leves@caesar.elte.hu></b> wrote ----<br></div><br><blockquote style="margin: 0px;"><div>Hi Tim, <br> <br>On Thu, 21 Oct 2021, gettimothy wrote: <br> <br>> Thx Levente. <br>> <br>> <br>> Should I attempt to fix this? How should it be approached? <br>> <br>> I have only a dim idea what "read buffering is" (file access is slow, so get a lot of data, at a certain threshold, asynchonously refill the buffer?). <br>> <br>> Is there an existing Stream that implemts it? <br>> <br>> Should I take the guts of that and put it in FSReadStream?  <br> <br>What is the snippet you execute to parse the documents? <br> <br>(I loaded Monty's XML parser and checking the code makes me think <br>that you create an FSReadStream not Monty's code). <br> <br> <br>Levente</div></blockquote></div><div><br></div></div><br></body></html>