<div dir="ltr">On Wed, Sep 3, 2008 at 12:25 PM, Brendan Gallagher <span dir="ltr">&lt;<a href="mailto:gallabr@biblio.org">gallabr@biblio.org</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi All -<br>
<br>
I&#39;ve been snooping around in the make_spellcheck_suggest.pl perl<br>
script and I&#39;ve developed a few questions.<br>
<br>
Looks like the script was originally written for Koha 2.4 CVS and<br>
hasn&#39;t quite been updated yet.<br>
I&#39;ve been working my way through updating the script (I&#39;m on perl 5.10<br>
and koha 3.1).<br>
<br>
Ok, my question is (or if someone has a better recommendation of a<br>
different path I should be chasing or working towards developing)<br>
<br>
Could someone lead me to the new mysql database tables for marc_word<br>
(or another equivalent) and correct me if I am wrong but I am equating<br>
&quot;marc_subfield_table&quot; with the newer mysql table<br>
marc_subfield_structure (plus i need to change subfieldvalue to either<br>
tagfield or tagsubfield). &nbsp;Below is the current part of the script<br>
that I am referencing,</blockquote><div><br>marc_subfield_structure is present in both versions, and is different from _table. It holds framework information (description of MARC subfields, and what they mean, like the title or author), rather than the values of those fields for any given record.<br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
&quot;<br>
my $query_words = &quot;SELECT DISTINCT word, COUNT(word) FROM marc_word&quot;;<br>
my $query_marc_subfields = &quot;SELECT DISTINCT subfieldvalue,<br>
COUNT(subfieldvalue) FROM marc_subfield_table&quot;;<br>
my $query_titles = &quot;SELECT DISTINCT title, COUNT(title) FROM biblio<br>
GROUP BY title&quot;;<br>
my $query_authors = &quot;SELECT DISTINCT author, COUNT(author) FROM biblio<br>
GROUP BY author&quot;;<br>
&quot;<br>
<br>
I do have the fuzzy searching set for my opac --&gt; but I am just<br>
looking a little bit more (and some of my searches dealing with these<br>
&quot;spellcheck&quot; suggestions are working - you can see that I have got it<br>
to populate some information in mysql database).<br>
<br>
Here is a copy of the message I get when executing this script. &nbsp;and I<br>
want to get ride of the &quot;excute failed&quot; -parts.<br>
<br>
Step 1 of 5: Checking to make sure suggest tables exist<br>
Use of uninitialized value $_ in pattern match (m//) at<br>
make_spellcheck_suggest.pl line 99.<br>
All tables present ... moving along<br>
Step 2 of 5: Deleting old data<br>
Step 3 of 5: Creating non-distinct table from various Koha tables<br>
Finished building marc_word list<br>
Adding marc_word entries with the following tagsubfields:020a, 100a,<br>
110a, 130a, 240a, 245a, 245b, 245c, 245p, 246a, 246b, 440a, 440p,<br>
505t, 511a, 534a, 600a, 610a, 611a, 630a, 650a, 651a, 700a, 710a,<br>
730a, 740a, 800a, 830a,<br>
DBD::mysql::st execute failed: Unknown column &#39;tagsubfield&#39; in &#39;where<br>
clause&#39; at make_spellcheck_suggest.pl line 173.<br>
DBD::mysql::st fetchrow_array failed: fetch() without execute() at<br>
make_spellcheck_suggest.pl line 179.<br>
0 more records added...<br>
Finished building marc_subfield_table list<br>
Adding marc_subfield_table entries with the following tags and<br>
subfields:020, a, 100, a, 110, a, 130, a, 240, a, 245, a, 245, b, 245,<br>
c, 245, p, 246, a, 246, b, 440, a, 440, p, 505, t, 511, a, 534, a,<br>
600, a, 610, a, 611, a, 630, a, 650, a, 651, a, 700, a, 710, a, 730,<br>
a, 740, a, 800, a, 830, a,<br>
DBD::mysql::st execute failed: Table &#39;koha.marc_subfield_table&#39;<br>
doesn&#39;t exist at make_spellcheck_suggest.pl line 173.<br>
DBD::mysql::st fetchrow_array failed: fetch() without execute() at<br>
make_spellcheck_suggest.pl line 179.<br>
0 more records added...<br>
57708 more records added...<br>
83598 more records added...<br>
Step 4 of 5: Deleting old distinct entries<br>
Step 5 of 5: Creating distinct spellcheck table out of non-distinct<br>
table<br>
Finished: total distinct items added to spellcheck: 81520<br>
</blockquote><div><br>Koha 3.0&#39;s new database schema does make this a bit harder; the script would have to parse the record from the biblioitems.marcxml or biblioitems.marc column, then find the words within that to add to the relevant tables.<br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Thanks,<br>
<br>
+++++++++++++++++++++++++++++++++++++++++++<br>
Brendan A. Gallagher<br>
Software Services Coordinator<br>
Bibliomation, INC.<br>
Middlebury, CT 06516<br>
<a href="http://www.biblio.org" target="_blank">http://www.biblio.org</a><br>
(203)577-4070 x119<br>
+++++++++++++++++++++++++++++++++++++++++++<br><br>
</blockquote></div><br>-- <br>Jesse Weaver<br>Software Developer, LibLime<br>
</div>