<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">2014-07-22 23:02 GMT+02:00 tim Rowledge <span dir="ltr">&lt;<a href="mailto:tim@rowledge.org" target="_blank">tim@rowledge.org</a>&gt;</span>:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Has anyone done any work on neatly integrating UTF8 strings, editing, our scanners, displaying with Cairo/pango etc?<br>

<br>
I have the Cairo/pango based Unicode plugin working on the pi but I&#39;d like to use it neatly rather than ad hoc hacky. Nic Cellier &amp; I did a lot of clean up last year for the scanners implementations of scanning but not so much for the displaying. It seems like something that ought to be done at some point. I&#39;m actually a bit miffed to discover that Cairo/pango requires UTF8 strings, which have to about the most complicated possible strings for editing. We have our Mac-roman encoded byte strings and full Unicode 32bit wide strings and can indeed convert to/from UTF8 but I&#39;m not too keen on constantly going back and forth.<br>

<br></blockquote><div><br></div><div>MacRoman? Beware Tim, you have slept too long, but I must tell you the awfull truth now.<br></div><div>ByteString are not anymore MacRoman encoded.<br></div><div>They are ISO8859L1 (latin 1) which matches Unicode on first 256 code points...<br>
<br></div><div>Converting to UTF8 seems hackish, but should just work.<br></div><div>Why would you have to go back from UTF8? Optimization? (storing the UTF8 result)<br></div><div><br></div><div>Or could we create a UTF8String class?<br>
</div><div> <br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Is there anything out there I can use?<br>
<br>
/tim<br>
{insert witticism here}<br>
</blockquote></div><br></div></div>