학사관리 업무를 맡고 있는데, 아직 수동이네요. 학생 수 만큼 문서 분량이 늘어납니다~ 성적은 모두 엑셀로, 증명서는 모두 한글 파일로 되어 있지요. 이번 학기만 잘 시작하고 나면 외주로 개발한다고 하던데...

단순반복 작업과 데이터에 사람 손 닿는 걸 매우 싫어하는 프로그래머 본능이 발동했습니다. 설 동안 짬짬이 테스트해 보았는데, 먼저 웹상에서 엑셀파일을 다루는 샘플~

그리고 웹상에서 PDF 편집하는 샘플~ TTF 를 풀어서 PDF에 넣을 수 있네요(1, 2) TTC는 TTF로 쪼개서 사용합니다(1, 2)

대학 다닐 때 접한 php 를 보고 못하는 게 없다고 생각했는데, jsp 도 마찬가지겠지만 참 기발하고 다양한 프로젝트들을 만드는 것 같습니다.

APM부터 차근히 설치하고, DB 설정을 하고 있노라니, 예전 회사 다니던 기억들이 새록새록 떠오릅니다. 

Posted by 마몸
요새 스마트폰들에서는 OCR 기능을 사용하고 있습니다. 명함을 찍어서 문자를 추출한 후 저장하거나, 실시간으로 카메라에 보이는 단어들을 번역해서 보여주기도 합니다. OCR 은 광학 문자 인식(Optical character recognition)을 줄여서 부르는 말이고, 이 기술은 오래 전부터 있었습니다. 다만, 문자 인식률이 저조해서 그리 인기는 없었지요. 헌데, 최근에는 발달한 알고리즘과 하드웨어 성능의 향상으로 꽤 쓸만해 진 것 같습니다. 

대표적으로 접할 수 있는 OCR 프로그램으로는 우선 Acrobat Professional Edition 이 있고, MS Office 를 사면 같이 들어 있는 MODI(Microsoft Office Document Imaging)가 있습니다. 또 기능상으로 가장 낫다고 말해지는 ABBYY FineReader 10 Professional Edition 이 있습니다. 조금 검색해 보니 네이버 랩에서 온라인으로 하는 이미지 문자 인식 ocr 도 있습니다.

1. Acrobat Pro
스캐너에서 PDF 문서 만들기를 클릭한 후에 아래와 같이 "검색 가능하게 만들기(OCR 실행)"에 체크해 주면 됩니다. 옵션에서 원하는 언어를 설정해 주면 더 잘 되지 않을까 싶습니다.

옵션들이 많은데 뭘 건드려야 하는지 몰라서 도움말 찾아봤습니다. 최적으로 인식되는 환경은 300dpi 흑백 스캔이라고 합니다. 위의 텍스트 인식 설정에서 이미지 다운샘플링은 별로 상관이 없나 봅니다. 스캔 해상도를 300dpi 로 맞춰주고, 그냥 흑백으로 스캔하면 잘 됩니다.

샘플로 하나 해 보았습니다.

텍스트로 내보내서 확인해 보니 아래와 같은 정도로 인식이 되네요.

2. MODI
다국어 지원 기능이 뛰어나다고 소문이 자자하던데, 실제로 해보니 엥~ 왠 에러?

GUI는 간단하게 잘 만들어져 있는 것 같은데, 잘 될 것 같은데 이상하게 문서안에 텍스트가 하나도 없다고 하네요. 음... 잘 소개하고 싶어도, pass 합니다~

p.s. 덤으로 컴퓨터에 MODI 가 설치되어 있으면 요런 응용을 할 수 있네요~

3. ABBYY Fine Reader 10
소개글을 보면 아주 성능이 뛰어나다고 합니다. 요 기사에 나온 그림들을 봐도 뭔가 레이아웃도 잘 맞추면서 인식하는 것으로 보입니다. 평가판을 다운 받아서 한번 확인해 봅니다.

설치도 오래 걸리고, 실행도 오래 걸리고, 변환도 오래 걸리고, 메모리도 무려 700MB 이상 차지하고(1G밖에 안되는 노트북이라 무지 swap하네요)~ 

결과물은? 

가장 많은 문자를 인식한 것 같은데, 문자가 깨질 때는 보기 심하게 깨져서 품질이 낮아 보이네요. 사용법을 숙지하면 더 나은 결과물이 나오지 않을까 기대해 봅니다~ 

4. 네이버 문자 인식 ocr
jpg 파일을 업로드 해서 웹상에서 문자로 인식을 해 줍니다. IE에서만 되네요; 5MB 제한이 있습니다.

스캔할 때 흑백 경계값을 얼마로 할지 몰라서 여러 번 스캔해서 올려 보고 ocr 적합성이 가장 높은 상태를 찾아봅니다.

몇 초 지나니 인식을 합니다. 마구 깨지는 것 같지만, 

교정이라는 기능을 하니 상당히 품질이 좋아집니다.


결론
어찌하다 보니 네 가지 프로그램들을 비교하게 되었습니다. 뭐 평소에 자주 써보던 기능이 아닌지라, 설정이나 사용법에 미숙한 채로 테스트 해 보았습니다. 그렇게 살짝 테스트 해 본 결과, Acrobat 이네요~ 원래 제 생각으로는 MODI가 가장 좋다고 생각하고 있었는데, 오늘 문서 인식 자체에 실패한 것을 보면 Acrobat이 다양한 환경에서 더 안정적인 장점이 있다고 볼 수 있겠습니다. 

   인식률  인식 속도   리소스  편의성  관리성  총점
 Acrobat  *****  ****  ***  *****  *****  22
 MODI  ?  ?  *****  ****  *****  14+α
 ABBYY Fine Reader  *****  ***  *  *****  *****  19
 naver ocr  ****  ***  ****  ***  *  15

* 리소스는 적게 차지할 수록 높은 점수, 관리성은 인식 및 스캔 결과물을 보관하기 편리할 수록 높은 점수를 줌.
Posted by 마몸
기어이 일을 저지르고 말았음!!! 내가 나한테 주는 생일선물인가? 소 뒷걸음 치다가 잡은 격~

Wireshark 로 패킷 캡쳐(필터:tcp dst port 554 && rtsp, 혹은 검색:tcp.dstport == 554 && rtsp.request[0-7] == "DESCRIBE") 받아서,

Orbit 으로 다운로드(rtsp:// 를 http://로 바꾸어)~

여기까지... (-_-+) 쉿~

Posted by 마몸
블로그 스팟이 다른 블로그들과 다른 점은 카테고리 기능과 트랙백 기능이 없다는 점입니다. 하지만 카테고리는 레이블 가젯을 사용해서 만들 수 있습니다.

 1. 가입, 블로그 생성, 변경, 삭제
 2. 글 쓰기/수정/삭제 
 3. 블로그 꾸미기 (카테고리)
 4. 블로그 스팟의 기능들 + α

먼저 "대시보드 > 수정할 블로그 > 레이아웃 > 페이지 요소"로 찾아들어갑니다.

카테고리를 넣고 싶은 자리에서 '가젯 추가'를 클릭합니다.

스크롤해서 "레이블" 가젯을 찾아서 "+" 버튼을 클릭해 설정합니다.

'제목'에 "카테고리" 혹은 원하는 이름을 붙여 줍니다. '색상'은 왜 있는지 모르겠네요. '표시'에서 모든 라벨이 아니라 "선택한 라벨"을 선택해 주고, 카테고리에 나타날 라벨을 골라줍니다. 게시물 입력할 때 카테고리로 사용할 라벨은 신경써서 입력해야 할 듯 하네요.

그럼, 아래와 같이 카테고리가 설정됩니다.

끝~

Posted by 마몸
블로그 첫 화면에 보일 글 개수를 조절하는 것 말고도, 블로그를 찾는 사람들의 스크롤의 압박을 줄일 수 있는 방법이 있습니다. 보통 블로그에서 "더 보기..." 라든가, "read more..." 로 표시되는 링크를 클릭하면 글이 펼쳐지는 기능입니다. (참고 1, 2)

 1. 가입, 블로그 생성, 변경, 삭제 
 2. 글 쓰기/수정/삭제 - (read more... 기능)
 3. 블로그 꾸미기
 4. 블로그 스팟의 기능들 + α

read more... 글 펼치기 기능을 넣기 위해서는 업그레이든 된 편집기를 사용해야 합니다. 그리고 나서 'read more...' 라든가, '더 보기...' 와 같은 메세지를 변경해 주면 됩니다.

1. 편집기 업그레이드
  업그레이드라고는 하지만, 몇 번의 클릭으로 마무리 됩니다. 아니면 이미 업그레이드가 되어 있을지 모릅니다. 아래와 같이 "새 게시물" 작성시 종이가 찢어진 모양의 아이콘이 있으면 됩니다. 점프 브레이크라는 용어를 사용하네요. 용어는 몰라도 상관 없습니다.

만약 이 아이콘이 보이지 않는다면 편집기를 업그레이드 합니다.  "대시보드 > 수정할 블로그 > 설정 > 기본사항" 으로 갑니다.

주욱 스크롤 해서 '게시물 편집기 선택' 항목에서 "편집기가 업데이트 됨" 을 선택하고 아래의 '설정 저장'을 눌러 줍니다.

그럼, 아래와 같이 'read more...' 나 '더 보기...' 를 본문에 넣을 수 있습니다. 가로줄이 좌악 생깁니다. 특정 구역을 묶을 수 있는 것은 아니고, 본문의 특정 부분 이후를 접는 기능을 합니다. 대신 'read more...' 로 표시된 부분을 클릭하면 다시 펼쳐 보여 줍니다.

2. 'read more...' 메세지 변경
 전혀 다른 곳에서 이 메세지를 변경해야 하는 번거로움이 있으나, 한번 설정해 두면 전체 설정에 반영이 되기 때문에 편리하기도 합니다.  "대시보드 > 수정할 블로그 > 레이아웃 > 페이지 요소" 에서 "블로그 게시물" 의 "수정"을 클릭합니다.

첫 화면의 게시물 개수를 설정하는 곳인데, 그 아래 'read more...' 를 '더 보기 »'와 같은 메세지로 바꿀 수 있습니다. 원하는 문구를 만들어 넣습니다. 
 
그리고, 설정 저장~

그러면 적용이 됩니다. 먼저 화면에는 아래와 같이 뿌려집니다.

'더 보기 »'를 클릭하면 아래와 같이 해당 게시물이 전부 보이게 됩니다.

끝~

Posted by 마몸

최근에 올라온 글

카테고리

모두 (497)
We BLOG (353)
테라피 (79)
재능 찾기 (62)
컴퓨터 팁 (57)
글쓰기 (1)

달력

«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

글 보관함