<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta content="text/html;charset=UTF-8" http-equiv="Content-Type"></head><body ><div style="font-family: Verdana, Arial, Helvetica, sans-serif; font-size: 10pt;"><div>Hi Tobias.<br></div><div><br></div><div><br></div><div>Thanks for the reply.<br></div><div><br></div><div><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>I think the \w does not do here what you think. <br></div><div><br></div><div>What happens is that the upper case I with dot above is encoded as UTF-8-Sequences-Percent-Encoded. <br></div><div>So you need a parser that is (a) aware of URL percent-escaping and (b) unicode/utf-8. <br></div><div>That is not what you DotNot does. It can only ascii, I presumeā€¦ <br></div><div><br></div><div>What kind of Regex-lib do you use? <br></div></blockquote><br></div><div style="" data-zbluepencil-ignore="true" class="zmail_extra"><blockquote style="margin: 0px;"><div><br>I have no idea. </div><div><br></div><div>I have basically inferred the functionality of the Grammar as I go with valuable insight from Levente.<br></div><div><br></div><div>There are a couple of PEG Grammar rules in Xtreams-Parsing that uses the character class to define some rules, example:<br></div></blockquote></div><div><br></div><div><br></div><div><blockquote style="border: 1px solid rgb(204, 204, 204); padding: 7px; background-color: rgb(245, 245, 245);"><div>whitespace                 <-   [\s\t\n\r]<br></div><div><br></div><div>Identifier                  <-   [a-zA-Z_] [a-zA-Z0-9_]*<br></div><div><br></div><div>NumLiteral                     <-   "Infinity" / "0" / [1-9] [0-9]*<br></div><div><br></div><div>Escape                             <-   BACKSLASH [x] [0-9A-F]{6} /     BACKSLASH [nrts\-\\\[\]\''\"] /    EscapeError<br></div></blockquote><div><br></div></div><div style="" data-zbluepencil-ignore="true" class="zmail_extra"><blockquote style="margin: 0px;"><div>So, whatever Xtreams or Squeak use for character classes? I have no idea.<br></div></blockquote></div><div><br></div><div><br></div></div><br></body></html>