日本語対応(openSUSEの場合)
以下、「機関リポジトリソフトウェアの日本語対応」を参考に、DSpaceの日本語対応をしていく。
画面の日本語化
> cd /usr/local/src/dspace-1.4.2-source/config/language-packs > wget http://dspace.svn.sourceforge.net/viewvc/*checkout*/dspace/tags/dspace-1_4_2/language-packs/ja/Messages_ja.properties?revision=1935 > mv Messages_ja.properties?revision=1935 Messages_ja.properties (DSpaceを更新)
このMessages_ja.propertiesは、
> native2ascii -reverse Messages_ja.properties Messages_ja.properties.utf
とすると、UTF-8のファイルに変換できるので、メッセージの日本語を適宜各自に合うものに修正してから、
> native2ascii -encoding UTF-8 Messages_ja.properties.utf Messages_ja.properties
として、再度変換する。
"Messages.properties"は、ブラウザにおいて優先言語を設定していない場合にデフォルトで使われる。また、英語(en)を設定していても使われる。
"Messages_[言語コード].properties"を作成すると、ブラウザで設定した優先言語に対応して、メッセージの表示言語を切り換えることができる。ただし、例えば"Messages_fr.properties"が存在しないと、ブラウザで設定した優先言語がfrだけの場合、???[キーの名前]???と表示されてしまう。enが設定してあれば、frより優先順位が下でも英語で表示されるようになる。
日本語メタデータの検索
「機関リポジトリソフトウェアの日本語対応」にある方法で、日本語メタデータを検索できるようにする。
Senをインストールする
> su - # cd /usr/local # wget https://sen.dev.java.net/files/documents/1373/31864/sen-1.2.2.1.zip # unzip sen-1.2.2.1.zip # chown -R dspace.dspace sen-1.2.2.1 # exit > cd /usr/local/sen-1.2.2.1/conf > vi sen.xml <charset>utf-8</charset> に変更 > vi sen-processor.xml <charset>utf-8</charset> に変更
Certificate verification errorが出る場合、wgetにオプション"--no-check-certificate"を付けてみてください。
変換辞書を作成する
> cd /usr/local/sen-1.2.2.1/dic > vi dictionary.properties sen.charset=utf-8 に変更 # dic.charset=EUC-JPは変更しない > ant (プロキシが必要な場合、ant -Dproxy.host=proxy.hoge.ac.jp -Dproxy.port=8080というようにする必要があるかもしれない。プロキシが使用できないときは、予めhttp://chasen.aist-nara.ac.jp/stable/ipadic/ipadic-2.6.0.tar.gzをダウンロードし、/usr/local/sen-1.2.2.1/dic以下に置いておけばよい。)
これで、da.sen, matrix.sen, posInfo.sen, token.senが作成される。
Lucene-jaをインストールする
DSpace1.4.1からlucene2.0を採用している。
> su - # cd /usr/local # wget https://sen.dev.java.net/files/documents/1373/35812/lucene-ja-2.0test2.zip # unzip lucene-ja-2.0test2.zip # chown -R dspace.dspace lucene-ja # exit
検索に使用する品詞を決める
> cd /usr/local/lucene-ja/lib (ファイルを展開する) > jar xvf lucene-ja.jar > cd org/apache/lucene/analysis/ja/ > vi analyzer-sen.xml <accept>要素の下の<pos>要素で検索に使用しない要素をコメントアウト(<!-- -->で囲む)する > cd /usr/local/lucene-ja/lib > mv lucene-ja.jar lucene-ja.jar.org (org以下のファイルをひとつにまとめる) $ jar cvf lucene-ja.jar org
lucene-ja.jar, sen.jar, commons-logging.jarをDSpaceにコピーする
> cd /usr/local/lucene-ja/lib/ > cp lucene-ja.jar sen.jar commons-logging.jar /usr/local/src/dspace-1.4.2-source/lib
DSAnalyzerの設定
> vi /usr/local/dspace/config/dspace.cfg search.analyzer = org.apache.lucene.analysis.ja.JapaneseAnalyzer を追加 > vi /usr/local/dspace/bin/dsrun 最後の行を次のように変更 java -Xmx256m -classpath $FULLPATH -Dsen.home=/usr/local/sen-1.2.2.1 "$@" > vi ~/.bashrc 環境変数JAVA_OPTSを変更 export JAVA_OPTS="-Xmx512M -Xms64M -Dfile.encoding=UTF-8 -Dsen.home=/usr/local/sen-1.2.2.1"
DSpaceの更新
> cd /usr/local/src/dspace-1.4.2-source > ant clean ← 最初のインストール時でなければ、これを実行すること > ant -Dconfig=/usr/local/dspace/config/dspace.cfg update > cp build/*.war /usr/local/apache-tomcat-6.0.14/webapps > rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace > rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace-oai
索引の再作成
> /usr/local/dspace/bin/index-all
Tomcatの起動
> /usr/local/apache-tomcat-6.0.14/bin/startup.sh
全文検索の日本語対応
「DSpaceで日本語コンテンツの全文検索を実現する」を参考に、全文検索できるようにする。これで、HTML, MSWord, PDFファイルの日本語全文検索が可能となる。
mediafilterへのパッチの適用
> cd /usr/local/src/dspace-1.4.2-source/src/org/dspace/app/mediafilter > wget http://www12.ocn.ne.jp/~zuki/Japanization/dspace142/mediafilter.patch > patch < mediafilter.patch
BitstreamStorageManager.javaへのパッチの適用
> cd /usr/local/src/dspace-1.4.2-source/src/org/dspace/storage/bitstore > wget http://www12.ocn.ne.jp/~zuki/Japanization/dspace142/BitstreamStorageManager.patch > patch < BitstreamStorageManager.patch
pdftotextのインストール先をDSpaceに知らせる
> vi /usr/local/dspace/config/dspace.cfg (以下を最後に追加) pdftotext.path = /usr/bin/pdftotext
DSpaceを更新する
> cd /usr/local/src/dspace-1.4.2-source > ant -Dconfig=/usr/local/dspace/config/dspace.cfg update > cp build/*.war /usr/local/apache-tomcat-6.0.14/webapps > rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace > rm -r /usr/local/apache-tomcat-6.0.14/webapps/dspace-oai
DSpaceのコンテンツの索引を再作成する
> /usr/local/dspace/bin/filter-media -f