<div dir="ltr">Thanks for the historic account, Chris!<div><br></div><div>So we didn't replace the leadingChar mechanism, we just redefined "leadingChar = 0" to mean "unicode" rather than "latin1".</div><div><br></div><div>The mechanism itself is still in place. It's a hack, admittedly, but as long as we're passing plain strings around we have no other way of retaining language information.</div><div><br></div><div>A better way may be to support Unicode variation selectors. Then again, I don't know too much about that. Any native speaker to help us out?</div><div><br></div><div>- Bert -<br><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jan 26, 2017 at 11:36 PM, Chris Cunningham <span dir="ltr"><<a href="mailto:cunningham.cb@gmail.com" target="_blank">cunningham.cb@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">So, back in 2009, Andreas proposed:<div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">---------------------------</span></div><div><span style="font-size:12.8px">What I would propose to do here is to define that "</span><span class="gmail-m_4909593041738272667gmail-il" style="font-size:12.8px;background-color:rgb(255,255,255)">leadingChar</span><span style="font-size:12.8px"> = 0" which currently means "Latin1 encoding, language neutral" is being redefined to "Unicode encoding, language neutral". What this does is that "Character value: 353" and "Unicode value: 353" become the same, if the environment is considered language neutral which by default it would be.</span><br style="font-size:12.8px"></div><div><span style="font-size:12.8px">---------------------</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">In 2010, he pushed this into Squeak Trunk.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Then, in 2011, there was a conversation where Andreas stated:</span></div><div><span style="font-size:12.8px"><br></span></div><div><div><span style="font-size:12.8px">-------------------</span></div><div><span style="font-size:12.8px">On 1/8/2011 2:16 AM, Sean P. DeNigris wrote:</span></div><div><span style="font-size:12.8px">#leadingChar</span></div><div><span style="font-size:12.8px">"In Squeak Character encoding, bits above 16r3FFFFF don't encode the</span></div><div><span style="font-size:12.8px">character, but hold information about the language environment and the</span></div><div><span style="font-size:12.8px">encoding which should be used to interpret the charCode. The background of</span></div><div><span style="font-size:12.8px">which is Han unification (<a href="http://en.wikipedia.org/wiki/Han_unification)" target="_blank">http://en.wikipedia.org/wiki/<wbr>Han_unification)</a>."</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">How's that as a method comment?  Is it really "In Squeak... encoding..." or</span></div><div><span style="font-size:12.8px">does this apply to unicode in general?</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">It is Squeak specific. Unicode does not have a leading char.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Cheers,</span></div><div><span style="font-size:12.8px">  - Andreas</span></div><div style="font-size:12.8px">---------------------</div></div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Maybe this later email was the one that you were interested in?</div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">I can't find any mention in the commit list or other discussions where the leadingChar was dropped, but I'm not an expert in this space (just interested).</div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Thanks,</div><div style="font-size:12.8px">cbc</div><div style="font-size:12.8px"><br></div></div></blockquote></div></div></div></div>