<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">I'm trying to deal with different string encodings in my image.<br><br>I've read some related posts but didn't find direct answers.<br><br>For the test I took unicode word 'привет'. Trying to input this string from keyboard, seaside web form and file stream I got 2 different formats:<br><br><br>FIRST FORMAT: comes from Keyboard Input, Seaside with WAKomEncoded<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>WideString<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>1: 1087.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>2: 1088.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>...<br>What is the format of that String, I guess it's exactly UTF-8.<br><br><br>SECOND FORMAT: comes from FileStream, FileIn, etc.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>WideString<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>1: 1069548607.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>2: 1069548608.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span><span class="Apple-tab-span" style="white-space: pre; ">        </span>...<br>The same question what is it? Is it UTF-32 or UCS2?<br><br>Both string are displayed correctly, but I'm failed to compare it.<br><br>So the questions are,<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>1. How to load data from files (e.g. FileStream) in first format (UTF-8?). I also need to do that for loading source code which contains unicode String's. May be I need to subclass UTF8TextConverter and call it UTF8ToUTF8TextConverter.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>2. &nbsp;How to setup WAKomEncoded and chars from keyboard to come in second format.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>3. What the encoding to choose as the base? What is the blueprint for it? I guess I just need learn how to load data in FIRST FORMAT and all will be ok.<br><span class="Apple-tab-span" style="white-space: pre; ">        </span>4. How to convert WideString in image from one format to another.<br><br>Unicode problem is still live here in Squeak :-) I'm confused how some great products like CMSBox fight against it. May be they don't even need to load data from external streams.<br><br>I'm using squeak-dev 3.9 image with installed UnicodeSupport (<a href="http://www.nabble.com/Re%3A--squeak-dev---ANN--3.10-final-is-out-p16182045.html">http://www.nabble.com/Re%3A--squeak-dev---ANN--3.10-final-is-out-p16182045.html</a>) to input unicode chars from keyboard. I'm on Mac. Don't even know what would be when I try to run in under Windows.</body></html>