Skip to content

Paper to HTML

논문을 읽기편한 HTML로 변환

Features

  • 머신러닝을 이용하여 PDF, LaTeX, PubMed Central XML 의 내용을 읽어서 HTML로 변환
  • 접근성 증대 목적
  • AI 기반 연구자료 검색엔진인 Semantic Scholar 의 실험적 프로토타입
  • 현재는 추출된 이미지/콘텐츠만 캐슁하며, 똑같은 문서를 업로드한 사람에게만 빠르게 서비스하는 용도로 사용됨. 업로드한 파일은 보관하지 않음
  • 제한 사항
    • 표(Table)는 이미지로 추출 됨
    • 수학(Math) 콘텐츠는 정확도가 낮거나 거의 추출되지 않음
    • LaTex/PubMed 처리는 PDF보다 기능이 일부 부족할 수 있음
  • 차후에 Semantic Scholar 에 접근성 기능을 추가할 계획을 가지고 있음

See also

Favorite site