OMEKA에 Ngram 및 Text Analysis 플러그인 설치하기( Apache Ant 및 Mallet 설치 포함)

오메카에서 Ngram 및 Text Analysis를 설치하는 방법입니다.
운영체제 Ubuntu 16.04 버젼에 Apache 2.4 이상, PHP 7.0 버젼 설치 기준입니다.
터미널에서 다음의 명령어 및 방법을 순서대로 실행하시면 됩니다.
순서대로 설치하지 않는 경우 설치 도중 에러가 발생할 수 있습니다.

1. 우분투 업데이트
$ sudo apt-get update

2. PHP intl 확장 모듈 설치
$ sudo apt-get install php7.0-intl

3. 아파치 웹서버 재시작
$ sudo /etc/init.d/apache2 restart

4. Ngram 플러그인 다운로드 후 압축 해제
https://github.com/omeka/plugin-Ngram/releases/download/v1.2/Ngram-1.2.zip

5. Text Analysis 플러그인 다운로드 후 압축 해제
https://github.com/omeka/plugin-TextAnalysis/releases/download/v2.5/TextAnalysis-2.5.zip

6. 압축 해제한 두 개 폴더를 서버의 오메카 플러그인 디렉토리에 업로드.
폴더명은 Ngram과 TextAnalysis 명칭으로 업로드 되어야 함.

7. TextAnalysis의 mallet_processing 디렉토리의 퍼미션 변경
$ sudo chmod -R 0777 /var/www/omeka/plugins/TextAnalysis/mallet_processing

8. JDK 설치 준비
$ sudo add-apt-repository ppa:webupd8team/java
$ sudo apt-get update
 
JDK 1.8 버젼 설치
$ sudo apt-get install oracle-java8-installer 
 
나노에디터로 시스템 path 환경설정파일 열기
$ sudo nano /etc/environment
 
다음의 라인을 마지막 라인에 추가하고 저장한 다음 에디터 모드 종료
JAVA_HOME="/usr/lib/jvm/java-8-oracle"

$ source /etc/environment

설치된 자바 버젼 확인
$ echo $JAVA_HOME

9. Apache Ant 설치
$ wget http://mirror.navercorp.com/apache//ant/binaries/apache-ant-1.10.5-bin.tar.gz
$ sudo tar -xf apache-ant-1.10.5-bin.tar.gz -C /usr/local
$ sudo ln -s /usr/local/apache-ant-1.10.5/ /usr/local/ant
$ sudo nano /etc/profile.d/ant.sh

아래 두 라인 복사 후 에디터에 붙여 넣고 ant.sh 파일 저장
export ANT_HOME=/usr/local/ant
export PATH=${ANT_HOME}/bin:${PATH}

$ source /etc/profile
$ sudo apt install ant
$ ant -version

10. Mallet 다운로드 및 압축 해제
http://mallet.cs.umass.edu/dist/mallet-2.0.8.zip

압축 해제한 mallet 디렉토리를 오메카의 TextAnalysis 플러그인 디렉토리 하위에 업로드

image

mallet 디렉토리 퍼미션 수정
$ sudo chmod -R 0777 /var/www/omeka/plugins/TextAnalysis/mallet

mallet 디렉토리로 이동
$ cd /var/www/omeka/plugins/TextAnalysis/mallet

mallet 디렉토리에서 Ant 실행
$ ant
$ ant jar

11. 오메카 관리자 모드 Plugins에서 Ngram 및 Text Analysis 플러그인 활성화.
Ngram은 활성화 후 설정에 들어가서 원하는 Text Element 선택.
Text Analysis는 Watson Natural Language Understanding 계정 설정 및 Mallet script directory 설정을 해야 셋팅 완료됨.
Watson의 경우 IBM의 Bluemix 계정이 필요하므로 먼저 계정을 Bluemix 사이트에서 만든 후 해당 계정 정보를 적용.
Mallet의 경우 script directory가 오메카의 TextAnalysis 플러그인 디렉토리 하위에 없으면 에러 발생되므로 주의!

image

12. 완료.


mallet 경로.jpg
674 x 268 - 109K
mallet 경로.jpg
674 x 268 - 109K
Text Analysis 및 Mallet 환경설정.jpg
728 x 589 - 261K
코멘트에 접속 혹은 등록.