2007年10月23日更新

日本語対応(openSUSEの場合)

以下、「機関リポジトリソフトウェアの日本語対応」を参考に、DSpaceの日本語対応をしていく。

画面の日本語化

> cd /usr/local/src/dspace-1.4.2-source/config/language-packs
> wget http://dspace.svn.sourceforge.net/viewvc/*checkout*/dspace/tags/dspace-1_4_2/language-packs/ja/Messages_ja.properties?revision=1935
> mv Messages_ja.properties?revision=1935 Messages_ja.properties
(DSpaceを更新)

このMessages_ja.propertiesは、

> native2ascii -reverse Messages_ja.properties Messages_ja.properties.utf

とすると、UTF-8のファイルに変換できるので、メッセージの日本語を適宜各自に合うものに修正してから、

> native2ascii -encoding UTF-8 Messages_ja.properties.utf Messages_ja.properties

として、再度変換する。

"Messages.properties"は、ブラウザにおいて優先言語を設定していない場合にデフォルトで使われる。また、英語(en)を設定していても使われる。

"Messages_[言語コード].properties"を作成すると、ブラウザで設定した優先言語に対応して、メッセージの表示言語を切り換えることができる。ただし、例えば"Messages_fr.properties"が存在しないと、ブラウザで設定した優先言語がfrだけの場合、???[キーの名前]???と表示されてしまう。enが設定してあれば、frより優先順位が下でも英語で表示されるようになる。

日本語メタデータの検索

「機関リポジトリソフトウェアの日本語対応」にある方法で、日本語メタデータを検索できるようにする。

Senをインストールする

> su -
# cd /usr/local
# wget https://sen.dev.java.net/files/documents/1373/31864/sen-1.2.2.1.zip
# unzip sen-1.2.2.1.zip
# chown -R dspace.dspace sen-1.2.2.1
# exit
> cd /usr/local/sen-1.2.2.1/conf
> vi sen.xml
    <charset>utf-8</charset> に変更
> vi sen-processor.xml
    <charset>utf-8</charset> に変更

Certificate verification errorが出る場合、wgetにオプション"--no-check-certificate"を付けてみてください。

変換辞書を作成する

> cd /usr/local/sen-1.2.2.1/dic
> vi dictionary.properties
     sen.charset=utf-8 に変更     # dic.charset=EUC-JPは変更しない
> ant
(プロキシが必要な場合、ant -Dproxy.host=proxy.hoge.ac.jp -Dproxy.port=8080というようにする必要があるかもしれない。プロキシが使用できないときは、予めhttp://chasen.aist-nara.ac.jp/stable/ipadic/ipadic-2.6.0.tar.gzをダウンロードし、/usr/local/sen-1.2.2.1/dic以下に置いておけばよい。)

これで、da.sen, matrix.sen, posInfo.sen, token.senが作成される。

Lucene-jaをインストールする

DSpace1.4.1からlucene2.0を採用している。

> su -
# cd /usr/local
# wget https://sen.dev.java.net/files/documents/1373/35812/lucene-ja-2.0test2.zip
# unzip lucene-ja-2.0test2.zip
# chown -R dspace.dspace lucene-ja
# exit

検索に使用する品詞を決める

> cd /usr/local/lucene-ja/lib
(ファイルを展開する)
> jar xvf lucene-ja.jar
> cd org/apache/lucene/analysis/ja/
> vi analyzer-sen.xml
    <accept>要素の下の<pos>要素で検索に使用しない要素をコメントアウト(<!-- -->で囲む)する

> cd /usr/local/lucene-ja/lib
> mv lucene-ja.jar lucene-ja.jar.org
(org以下のファイルをひとつにまとめる)
$ jar cvf lucene-ja.jar org

lucene-ja.jar, sen.jar, commons-logging.jarをDSpaceにコピーする

> cd /usr/local/lucene-ja/lib/
> cp lucene-ja.jar sen.jar commons-logging.jar /usr/local/src/dspace-1.4.2-source/lib

DSAnalyzerの設定

> vi /usr/local/dspace/config/dspace.cfg

search.analyzer = org.apache.lucene.analysis.ja.JapaneseAnalyzer
を追加

> vi /usr/local/dspace/bin/dsrun
最後の行を次のように変更
java -Xmx256m -classpath $FULLPATH -Dsen.home=/usr/local/sen-1.2.2.1 "$@"

> vi ~/.bashrc
環境変数JAVA_OPTSを変更
export JAVA_OPTS="-Xmx512M -Xms64M -Dfile.encoding=UTF-8 -Dsen.home=/usr/local/sen-1.2.2.1"

DSpaceの更新

> cd /usr/local/src/dspace-1.4.2-source
> ant clean  ← 最初のインストール時でなければ、これを実行すること
> ant -Dconfig=/usr/local/dspace/config/dspace.cfg update
> cp build/*.war /usr/local/apache-tomcat-6.0.14/webapps
> rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace
> rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace-oai

索引の再作成

> /usr/local/dspace/bin/index-all

Tomcatの起動

> /usr/local/apache-tomcat-6.0.14/bin/startup.sh

全文検索の日本語対応

「DSpaceで日本語コンテンツの全文検索を実現する」を参考に、全文検索できるようにする。これで、HTML, MSWord, PDFファイルの日本語全文検索が可能となる。

mediafilterへのパッチの適用

> cd /usr/local/src/dspace-1.4.2-source/src/org/dspace/app/mediafilter
> wget http://www12.ocn.ne.jp/~zuki/Japanization/dspace142/mediafilter.patch
> patch < mediafilter.patch

BitstreamStorageManager.javaへのパッチの適用

> cd /usr/local/src/dspace-1.4.2-source/src/org/dspace/storage/bitstore
> wget http://www12.ocn.ne.jp/~zuki/Japanization/dspace142/BitstreamStorageManager.patch
>  patch < BitstreamStorageManager.patch

pdftotextのインストール先をDSpaceに知らせる

> vi /usr/local/dspace/config/dspace.cfg

(以下を最後に追加)
pdftotext.path = /usr/bin/pdftotext

DSpaceを更新する

> cd /usr/local/src/dspace-1.4.2-source
> ant -Dconfig=/usr/local/dspace/config/dspace.cfg update
> cp build/*.war /usr/local/apache-tomcat-6.0.14/webapps
> rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace
> rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace-oai

DSpaceのコンテンツの索引を再作成する

> /usr/local/dspace/bin/filter-media -f