<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:st1="urn:schemas-microsoft-com:office:smarttags" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1258">
<meta name=Generator content="Microsoft Word 11 (filtered medium)">
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="PlaceType"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="PlaceName"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="country-region"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="PostalCode"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="State"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="City"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="place"/>
<!--[if !mso]>
<style>
st1\:*{behavior:url(#default#ieooui) }
</style>
<![endif]-->
<style>
<!--
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman";}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline;}
p
        {mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman";}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:Arial;
        color:windowtext;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.25in 1.0in 1.25in;}
div.Section1
        {page:Section1;}
-->
</style>

</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Play time is over and I am now building a couple of servers
using Ubuntu 8.04 and the latest git version of Koha. So far the installations
have been clean and easy. I have just one more UTF-8 encoding question.<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Being in the southwestern <st1:country-region w:st="on"><st1:place
 w:st="on">U.S.</st1:place></st1:country-region> we are trying to deal with
some titles that have Spanish character sets to go along with our primarily
English character sets. In looking over Koha Wiki entry for encoding and
character sets, <a href="http://wiki.koha.org/doku.php?id=encodingscratchpad">http://wiki.koha.org/doku.php?id=encodingscratchpad</a>.,
I have a question about the section on combining characters and collations. The
search entry may not necessarily have the special character, but we need to
return records with special characters. For those who have had to deal with
this, which would you recommend, utf8_unicode_ci or utf8_general_ci for the
collation collection?<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>The
word Univerzalitaěs is a unicode combining form. When you copy/paste it into a
text editor or use a keyboard to type it, it is most likely going to be the
non-combining form: Univerzalitás. (in the non-combining form, the hex for the
accented a is: Hex 0301; for the non-combining form it’s: Hex 61, Hex 00e1). <o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>Non-combining
form: <a href="http://www.fileformat.info/info/unicode/char/00e1/index.htm"
title="http://www.fileformat.info/info/unicode/char/00e1/index.htm">http://www.fileformat.info/info/unicode/char/00e1/index.htm</a>
<o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>Combining
form: <a href="http://www.fileformat.info/info/unicode/char/61/index.htm"
title="http://www.fileformat.info/info/unicode/char/61/index.htm">http://www.fileformat.info/info/unicode/char/61/index.htm</a>
<a href="http://www.fileformat.info/info/unicode/char/0301/index.htm"
title="http://www.fileformat.info/info/unicode/char/0301/index.htm">http://www.fileformat.info/info/unicode/char/0301/index.htm</a>
<o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>Univerzalitás
Univerzalitaěs <o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>It
seems that the utf8_general_ci collation doesn’t support equality for those two
forms. However, utf8_unicode_ci seems to work. If you have combining characters
in your data, you may want to go with statements like: <o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>ALTER
TABLE marc_word MODIFY word VARCHAR(255) CHARACTER SET utf8 COLLATE
utf8_unicode_ci; <o:p></o:p></span></font></p>

<p><font size=3 face="Times New Roman"><span lang=EN style='font-size:12.0pt'>and
be sure to add init-connect = ‘SET collation_connection = utf8_unicode_ci’ to
your my.cnf <o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Thanks,<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>John<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><o:p>&nbsp;</o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>+----------------------------------------------------------------------------+</span></font><o:p></o:p></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>John Chadwick, Ed.D. Information Technology Manager</span></font><o:p></o:p></p>

<p class=MsoNormal><st1:place w:st="on"><st1:PlaceName w:st="on"><font size=2
  face=Arial><span style='font-size:10.0pt;font-family:Arial'>New Mexico</span></font></st1:PlaceName><font
 size=2 face=Arial><span style='font-size:10.0pt;font-family:Arial'> <st1:PlaceType
 w:st="on">State</st1:PlaceType></span></font></st1:place><font size=2
face=Arial><span style='font-size:10.0pt;font-family:Arial'> Library</span></font><o:p></o:p></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>1209 Camino Carlos Rey</span></font><o:p></o:p></p>

<p class=MsoNormal><st1:place w:st="on"><st1:City w:st="on"><font size=2
  face=Arial><span style='font-size:10.0pt;font-family:Arial'>Santa Fe</span></font></st1:City><font
 size=2 face=Arial><span style='font-size:10.0pt;font-family:Arial'>, <st1:State
 w:st="on">NM</st1:State> <st1:PostalCode w:st="on">87507</st1:PostalCode></span></font></st1:place><o:p></o:p></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'>Phone: 505-476-9740&nbsp; Cell: 505-629-8116 Fax:
505-476-9761</span></font><o:p></o:p></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><a href="mailto:john.chadwick@state.nm.us">john.chadwick@state.nm.us</a></span></font><o:p></o:p></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:10.0pt;
font-family:Arial'><a href="http://www.nmstatelibrary.org">http://www.nmstatelibrary.org</a></span></font><o:p></o:p></p>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'><o:p>&nbsp;</o:p></span></font></p>

</div>

<DIV>&nbsp;</DIV><br><br>Confidentiality Notice: This e-mail, including all attachments is for the sole use of the intended recipient(s) and may contain confidential and privileged information. Any unauthorized review, use, disclosure or distribution is prohibited unless specifically provided under the New Mexico Inspection of Public Records Act. If you are not the intended recipient, please contact the sender and destroy all copies of this message. -- This email has been scanned by the Sybari - Antigen Email System. <br><br><br></body>

</html>