<div dir="ltr"><br><br><div class="gmail_quote">On Mon, Jan 7, 2013 at 6:05 PM, Mark Morgan Lloyd <span dir="ltr"><<a href="mailto:markMLl.fpc-devel@telemetry.co.uk" target="_blank">markMLl.fpc-devel@telemetry.co.uk</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">Tomas Hajny wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On Mon, January 7, 2013 13:28, Ewald wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Once upon a time, on 01/07/2013 12:39 PM to be precise, Michael Schnell<br>
said:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
On 01/05/2013 12:28 PM, Jonas Maebe wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Using whatever #xx#xx or #xx#xx#xx sequence represents the UTF-8<br>
encoding of that character.<br>
</blockquote>
Sorry, I can't follow. Does #xx not just define a numerical<br>
representation of an 8 bit entity ?<br>
<br>
The interpretation in any code might be done later by any code that<br>
digests the string.<br>
<br>
Am I wrong ?<br>
</blockquote>
I *think* Jonas is trying to say that if you want the character `Ǿ` in a<br>
string you would either type<br>
- 'Ǿ' or<br>
- #$C7#$BE if you want to keep the source free of encoding specific<br>
characters<br>
</blockquote>
 .<br>
 .<br>
<br>
...or<br>
- #$01FE and then the whole string becomes a Unicode string which is<br>
either kept that way (if it is assigned to a UnicodeString constant), or<br>
it is converted to some 8-bit encoding at compile time (if it is assigned<br>
to an 8-bit constant/variable like ansistring)<br>
<br>
(also just my understanding of what Jonas wrote)<br>
</blockquote>
<br></div></div>
That's how I read it as well. In which case, is #A3 16-bit Unicode (representing the UK £ Sterling) or malformed UTF-8 (should be #c2#a3)?<span class="HOEnZb"><font color="#888888"><br>
</font></span></blockquote><div> </div><div>The way I understand it is that #A3 will be effected by $codepage directive of source file. So, if programmer correctly sets $codepage to match encoding used in editor (be it utf8 or some other encoding), compiler will also 'understand' that string correctly.</div>

<div><br></div><div>If programmer never uses UnicodeString, and always uses codepage which was used to write source code, everything will work fine - #A3 will stay whatever it is in specific encoding.</div><div><br></div>

<div>On the other hand, if there comes situation in which string containing #A3 needs to be converted to UnicodeString, compiler will either: a) convert it correctly to UnicodeString if encoding used is utf8, or b) call system-specific function to convert string to array of WideChar-s (in which case, correctness of the program depends on support for specific encoding on tharget system).</div>

<div><br></div><div><br></div><div><br></div><div><br></div></div></div>