<div id="RTEContent">When I imported a MARC record with chinese characters using MARCedit to convert the file into UTF8, several of the characters did not display properly (see attached file) I already set the web browser encoding to match with MARC Edit.&nbsp; Still come up with the same problem... it looks like during the import process, some characters were not read correctly by Koha?<br><br>Has anyone encountered similar problem?<br><br><b><i>Thomas D &lt;koha@alinto.com&gt;</i></b> wrote:<blockquote class="replbq" style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"> Carol,<br><br>I believe that Firefox is up to version 1.5 but 1.5 may be only a beta<br>release currently.  I suspect the configuration of Firefox is more likely to<br>be the problem.  Try changing the font used within Firefox to the same one<br>used for MARCEdit.  Find edit preferences in the drop down menus for Firefox<br>or the MS Windows version equivalent.  Go to Edit
 Preferences : General :<br>Choose Fonts and Colors.<br><br>I suspect the reason the problem is manifest even while the font that you<br>have currently selected in Firefox may display the same character correctly<br>when you type it is because two almost identical glyphs are used in Unicode<br>for the same basic character sometimes.  Whatever font you have currently<br>configured for Firefox  may be unable to display the glyph that MARCEdit<br>assigned in the conversion of the record to UTF-8.  The optimal font should<br>display the different glyphs correctly for the same basic character.  The<br>actual keystrokes required to generate the different glyphs will be<br>different even if the basic character is the same.<br><br><br>MAILING LISTS<br><br>The links on koha.org seem to have been fixed now.  Try<br>http://www.koha.org/community/mailing-lists.html .<br><br><br>Thomas D<br><br><br>Quoting Carol Ku <carolcool01@yahoo.com> :<br>&gt; ---------------- Beginning of the original
 message ------------------<br>&gt; <br>&gt; Hi Thomas:<br>&gt;   I am using Mozilla Firefox, i thought there is only one<br>&gt; version?  1.0?  Koha<br>&gt; 2.2.4.  Yes I used the bulkmarcimport... Yes, the problem<br>&gt; remains in Chinese...<br>&gt; only for one or two characters though.... If I were to enter<br>&gt; the data myself, it<br>&gt; wouldn't cause a problem...<br>&gt;    <br>&gt;   Oh, the window mailing list... i sent emails to savannah<br>&gt; before, but all were<br>&gt; bounced back, so I resubscribe it again through koha home<br>&gt; page, and i was given<br>&gt; the old mailing list.... Yes you are right, i have not been<br>&gt; getting any response<br>&gt; from windows mailing list.<br>&gt;   <br>&gt; <br>&gt; Thomas D <koha@alinto.com> wrote:<br>&gt;   MULTITUDE OF CHARACTER SETS AND ENCODINGS<br>&gt; <br>&gt; There are variant encodings of Unicode. UTF-8 is but one of<br>&gt; them. There<br>&gt; are also other encodings such as UTF-16, UTF-32, and
 USC2.<br>&gt; Conversion<br>&gt; applications can convert between different encodings.<br>&gt; <br>&gt; MS Windows can use UTF-16 directly for keyboard output but not<br>&gt; UTF-8. To my<br>&gt; knowledge there are no keyboard generation applications that<br>&gt; work around<br>&gt; this problem directly.<br>&gt; <br>&gt; Unix can use UTF-8 directly for keyboard output so encoding<br>&gt; conversion<br>&gt; issues are less problematic.<br>&gt; <br>&gt; MARC records have more usually used other older character sets<br>&gt; to represent<br>&gt; similar sets of characters to Unicode. These library character<br>&gt; set<br>&gt; standards were developed before Unicode existed. One such<br>&gt; standard that is<br>&gt; prevalent in MARC-21 records is the MARC-8 character set.<br>&gt; MARC-8 should not<br>&gt; be confused with UTF-8. They are not compatible but character<br>&gt; set<br>&gt; conversion applications can convert between them.<br>&gt; <br>&gt; <br>&gt; CHARCTER SETS AND
 ENCODINGS IN KOHA<br>&gt; <br>&gt; Koha 3.0 should convert between MARC-8 and UTF-8 for at least<br>&gt; major Western<br>&gt; European languages. Chinese may have to wait for Koha 3.0.X.<br>&gt; especially as<br>&gt; I do not know how to identify which Chinese glyphs are which.<br>&gt; At least with<br>&gt; Western European languages, I know how to read the alphabets<br>&gt; even when I do<br>&gt; not know how to read the language.<br>&gt; <br>&gt; Previously you have changed the Koha SQL columns from ISO 8859<br>&gt; to UTF-8 if<br>&gt; necessary and the charset headers for the web pages that Koha<br>&gt; sends to the<br>&gt; webserver from ISO 8859 to UTF-8. The web browser then would<br>&gt; seem to have<br>&gt; done a certain degree of conversion work automatically that I<br>&gt; had not<br>&gt; expected would happen as well for characters that you typed as<br>&gt; opposed to<br>&gt; characters that were merely displayed within the web browser.<br>&gt; However, this<br>&gt;
 seems to have worked for you so far on MS Windows. I would<br>&gt; presume that the<br>&gt; web browser itself would then be converting between UTF-16<br>&gt; from MS Windows<br>&gt; and UTF-8 inside the web browser before posting back to Koha.<br>&gt; <br>&gt; If the issue that you have now is only for one or two<br>&gt; characters after a<br>&gt; conversion, that seems like the converting application had<br>&gt; partial failure.<br>&gt; I would suggest that the conversion inside MARCedit was<br>&gt; successful but that<br>&gt; the conversion inside your web browser for Koha was less<br>&gt; succesful. What<br>&gt; web browser and version are you using with Koha?<br>&gt; <br>&gt; I am assuming that the most all of the characters in your<br>&gt; problematic<br>&gt; records are in Chinese. I am also assuming that you have used<br>&gt; bulkmarcimport.pl to import these records. Please let me know<br>&gt; if either is<br>&gt; not the case.<br>&gt; <br>&gt; <br>&gt; KOHA WINDOWS LIST
 CHANGE<br>&gt; <br>&gt; Do you have any responses from the Savannah list any longer?<br>&gt; The address<br>&gt; for the Koha Windows list is now koha-win32@nongnu.org . This<br>&gt; change is<br>&gt; part of a move of the Koha project from Sourceforge to<br>&gt; Savannah. The<br>&gt; Sourceforge site had become much to unresponsive with the<br>&gt; volume of users<br>&gt; relative to the provision of servers. You should have a better<br>&gt; response<br>&gt; about MS Windows issues on the MS Windows list. Unfortunate<br>&gt; mailing lists<br>&gt; on Savannah do seem to suffer from delays in the mail queue.<br>&gt; <br>&gt; <br>&gt; Thomas D<br>&gt; <br>&gt; <br>&gt; Quoting Carol Ku :<br>&gt; &gt; ---------------- Beginning of the original message<br>&gt; ------------------<br>&gt; &gt; <br>&gt; &gt; I imported two book records with chinese characters.<br>&gt; However,<br>&gt; &gt; there are about<br>&gt; &gt; one or two characters that show up wacky. I used MARCEdit to<br>&gt;
 &gt; convert the text<br>&gt; &gt; file into MARC UTF file. When I open the file using<br>&gt; MARCedit,<br>&gt; &gt; all the<br>&gt; &gt; characters look fine.<br>&gt; &gt; <br>&gt; &gt; I was told that MARCEdit uses Arial Unicode MS, is it the<br>&gt; &gt; same code as UTF8? <br>&gt; &gt; If not, how can I oversome this problem?<br>&gt; &gt; <br>&gt; &gt; __________________________________________________<br>&gt; &gt; Do You Yahoo!?<br>&gt; &gt; Tired of spam? Yahoo! Mail has the best spam protection<br>&gt; &gt; around <br>&gt; &gt; http://mail.yahoo.com<br>&gt; &gt; <br>&gt;     <br>&gt; ---------------------------------<br>&gt;   _______________________________________________<br>&gt; &gt; Koha mailing list<br>&gt; &gt; Koha@lists.katipo.co.nz<br>&gt; &gt; http://lists.katipo.co.nz/mailman/listinfo/koha<br>&gt; &gt; <br>&gt; &gt; ------------------- End of the original message<br>&gt; ---------------------<br>&gt; <br>&gt; <br>&gt; <br>&gt; <br>&gt;
 ---------------------------------------------<br>&gt; Protect your mails from viruses thanks to Alinto Premium<br>&gt; services<br>&gt; http://www.alinto.com<br>&gt;   <br>&gt; <br>&gt; <br>&gt; __________________________________________________<br>&gt; Do You Yahoo!?<br>&gt; Tired of spam?  Yahoo! Mail has the best spam protection<br>&gt; around <br>&gt; http://mail.yahoo.com <br>&gt; ------------------- End of the original message ---------------------<br><br><br><br><br>---------------------------------------------<br>Protect your mails from viruses thanks to Alinto Premium services http://www.alinto.com<br></koha@alinto.com></carolcool01@yahoo.com></blockquote><br></div><p>__________________________________________________<br>Do You Yahoo!?<br>Tired of spam?  Yahoo! Mail has the best spam protection around <br>http://mail.yahoo.com