>From http://source.squeak.org/inbox/Regex-Core-ct.68.diff:<br>
<br>
A new version of Regex-Core was added to project The Inbox:<br>
http://source.squeak.org/inbox/Regex-Core-ct.68.mcz<br>
<br>
==================== Summary ====================<br>
<br>
Name: Regex-Core-ct.68<br>
Author: ct<br>
Time: 23 August 2021, 9:21:12.58334 pm<br>
UUID: 6159117b-a67f-bd4a-b30a-82fe1b4abb09<br>
Ancestors: Regex-Core-mt.61<br>
<br>
Adds support for unicode backslash atoms.<br>
<br>
Some examples:<br>
<br>
    ''Squeak is the perfect language'' allRegexMatches: ''\w*\u{61}\w*''. "--> #(''Squeak'' ''language'')"<br>
    ''Squeak is beautiful'' allRegexMatches: ''\w*\x75\w*''. "--> #(''Squeak'' ''beautiful'')<br>
    ''$1.00 = ¬0.85 = £0.73'' allRegexMatches: ''\p{Sc}\d+\.\d+''. "--> (''$1.00'' ''¬0.85'' ''£0.73'')"<br>
    ''Carpe Squeak!'' allRegexMatches: ''\p{L}+''. "--> #(''Carpe'' ''Squeak'')"<br>
    '' get rid of all these nonsense separators'' allRegexMatches: ''\P{Z}+''. "--> (''get'' ''rid'' ''of'' ''all'' ''these'' ''nonsense'' ''separators'')"<br>
<br>
Requires Multilingual-ct.259.<br>
<br>
=============== Diff against Regex-Core-mt.61 ===============<br>
<br>
Item was changed:<br>
Object subclass: #RxParser<br>
    instanceVariableNames: ''input lookahead''<br>
+     classVariableNames: ''BackslashConstants BackslashSpecials HexDigits''<br>
-     classVariableNames: ''BackslashConstants BackslashSpecials''<br>
    poolDictionaries: ''''<br>
    category: ''Regex-Core''!<br>
<br>
!RxParser commentStamp: ''Tbn 11/12/2010 23:13'' prior: 0!<br>
-- Regular Expression Matcher v 1.1 (C) 1996, 1999 Vassili Bykov<br>
--<br>
The regular expression parser. Translates a regular expression read from a stream into a parse tree. (''accessing'' protocol). The tree can later be passed to a matcher initialization method. All other classes in this category implement the tree. Refer to their comments for any details.<br>
<br>
Instance variables:<br>
    input        <Stream> A stream with the regular expression being parsed.<br>
    lookahead    <Character>!<br>
<br>
Item was added:<br>
+ ----- Method: RxParser class>>digitsForBase: (in category ''private'') -----<br>
+ digitsForBase: base<br>
+ <br>
+     ^ ($0 to: $9)<br>
+         , (($a to: $z) take: base - 10)<br>
+         , (($A to: $Z) take: base - 10)!<br>
<br>
Item was added:<br>
+ ----- Method: RxParser class>>hexDigits (in category ''constants'') -----<br>
+ hexDigits<br>
+ <br>
+     ^ HexDigits ifNil: [HexDigits := self digitsForBase: 16]!<br>
<br>
Item was changed:<br>
----- Method: RxParser class>>initializeBackslashSpecials (in category ''class initialization'') -----<br>
initializeBackslashSpecials<br>
+     "The keys are characters that normally follow a $\, the values are either associations of classes and initialization selectors on their instance side, or evaluables that will be evaluated on the current parser instance."<br>
-     "Keys are characters that normally follow a \, the values are<br>
-     associations of classes and initialization selectors on the instance side<br>
-     of the cl<br>
<br>
<br>
Hrmpf.<br>
<br>
<font color="#808080">---<br>
</font><i><font color="#808080">Sent from </font></i><i><u><a href="https://github.com/hpi-swa-lab/squeak-inbox-talk"><font color="#808080">Squeak Inbox Talk</font></a></u></i><br>
<br>
On 2021-08-23T21:22:57+02:00, christoph.thiede@student.hpi.uni-potsdam.de wrote:<br>
<br>
> So unfortunately there was no notification about this version, once again, because I have inserted some too special characters in its summary. As an alternative, let me announce my changes here again:<br>
> <br>
>     Name: Regex-Core-ct.68<br>
>     Author: ct<br>
>     Time: 23 August 2021, 9:21:12.58334 pm<br>
>     UUID: 6159117b-a67f-bd4a-b30a-82fe1b4abb09<br>
>     Ancestors: Regex-Core-mt.61<br>
> <br>
>     Adds support for unicode backslash atoms.<br>
> <br>
>     Some examples:<br>
> <br>
>         'Squeak is the perfect language' allRegexMatches: '\w*\u{61}\w*'. "--> #('Squeak' 'language')"<br>
>         'Squeak is beautiful' allRegexMatches: '\w*\x75\w*'. "--> #('Squeak' 'beautiful')"<br>
>         (WebUtils jsonDecode: '"$1.00 = \u20AC0.85 = \u00A30.73"' readStream) allRegexMatches: '\p{Sc}\d+\.\d+'. "--> ('$1.00' '?0.85' '?0.73')"<br>
>         'Carpe Squeak!' allRegexMatches: '\p{L}+'. "--> #('Carpe' 'Squeak')"<br>
>         (WebUtils jsonDecode: '" get rid of \u2007all these nonsense separators"' readStream) allRegexMatches: '\P{Z}+'. "--> ('get' 'rid' 'of' 'all' 'these' 'nonsense' 'separators')"<br>
> <br>
>     Requires Multilingual-ct.259.<br>
> <br>
> Tests are in Regex-Tests-Core-ct.24. Looking forward to all your feedback! :-)<br>
> <br>
> Best,<br>
> Christoph<br>
> <br>
> ---<br>
> Sent from Squeak Inbox Talk<br>
> -------------- next part --------------<br>
> An HTML attachment was scrubbed...<br>
> URL: <http://lists.squeakfoundation.org/pipermail/squeak-dev/attachments/20210823/ad1b2d86/attachment.html><br>
> <br>