Papers
Paper 목록 뿐만 아닌, 그 밖의 흥미로운 주제도 모두 포함한다.
Computer Vision
FALdetector
|
Photoshop 스크립팅을 통해 Photoshopped 얼굴 감지 |
Photo Wake-Up
|
단일 이미지를 사용하여 3D 캐릭터 애니매에션을 만든다. |
Image Deduplicator
|
비슷한 이미지를 쉽게 찾을수 있다. |
Image Inpainting for Irregular Holes Using Partial Convolutions
|
부분 컨벌루션을 사용하여 불규칙한 구멍에 대한 이미지 인 페인팅 |
Noise2Noise
|
영상의 노이즈를 제거한다. |
Super SloMo
|
일반영상을 슬로우 모션 영상으로 만든다. |
Video-to-Video
|
입력 비디오에서 내용을 정확하게 묘사하는 사실적인 비디오로 출력한다. |
Towards-Realtime-MOT
|
딥러닝 기반, 빠른 다중 객체 추적기 |
Poly-MOT
|
3D 다중 객체 추적을 위한 다면체 프레임워크 |
Learning to Predict 3D Objects with an Interpolation-based Differentiable Renderer
|
2D 사진 1장으로 3D 모델 만드는 AI |
PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
|
사람 사진 1장으로 3D 모델 만드는 AI |
Image GPT
|
SinGAN
Learning a Generative Model from a Single Natural Image
CRAFT
|
OCR을 위한 텍스트 영역 분할. |
MONAI
|
AI Toolkit for Healthcare Imaging |
C3DPO
|
모션에서 비 강성 구조를위한 정식 3D 포즈 네트워크 |
f-BRS
|
어노테이션 툴로 사용하기 좋은, 영역 선택 -> 객체 선택. |
virtual-walk
|
Virtual walks in Google Street View using PoseNet and applying Deep Learning models to recognize actions. |
SwAV
|
클러스터 할당을 대조하여 시각적 기능에 대한 비지도 학습 (Unsupervised Learning) |
DeepSORT
여러사람 트래킹 할 때 필요할듯 |
OCRNet
b5t에서 현대제강 진행할 때 사용한 Semantic Segmentation
Surface Crack Detection (Outlier Detection)
|
alibi-detect의 VAE를 사용하여 콘크리트 표면의 금 간 부분을 알아내는 실용적인 인공지능 모델 |
Deep Daze
|
텍스트에서 이미지 생성하기. |
Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network) |
Deep Daze 항목 참조. |
MMSkeleton
|
스켈레톤으로 행위 인식 |
MMSkeleton 항목 참조. |
Monodepth2
|
이미지에서 깊이 맵을 예측합니다. |
Depth Prediction, Monodepth2 항목 참조. |
Multi-person Real-time Action Recognition Based-on Human Skeleton
|
OpenPose에서 골격에 ML을 적용합니다. 9 개의 행동; 여러 사람. |
SOLD2
|
특징 선 감지 및 설명을 위한 Joint 심층 네트워크. |
Self-supervised Occlusion-aware Line Description and Detection (SOLD2) 항목 참조. |
Self-Supervised Vision Transformers with DINO
|
DINO를 위한 PyTorch 구현 및 사전 훈련 된 모델. |
Handsfree.js
|
웹에서 얼굴/손/포즈 인식을 쉽게 |
What-If Tool
|
최소한의 코딩으로 훈련 된 기계 학습 모델의 동작을 시각적으로 조사합니다. |
Physics-based Human Motion Estimation and Synthesis from Videos
|
비디오에서 물리학 기반 인간 모션 추정 및 합성 - Physics-based Human Motion Estimation and Synthesis from Videos (ICCV 2021) |
https://nv-tlabs.github.io/physics-pose-estimation-project-page/ |
LoFTR: Detector-Free Local Feature Matching with Transformers
|
트랜스포머를 사용한 감지기 없는 로컬 피쳐 매칭 |
LaMa
|
큰해상도 이미지에서 사물 지우기 |
Self-supervised Geometric Correspondence for Category-level 6D Object Pose Estimation in the Wild
|
카테고리 수준의 6D 물체 포즈 추정을 위한 자체 지도형 기하학적 대응 |
S-NeRF - Neural Radiance Fields for Street Views
|
스트리트 뷰를 위해 영상으로 부터 깊이 정보를 추출 |
Animated Drawings
|
아이들 그림을 애니메이트 시키기 오픈소스 |
Segment Anything in High Quality
|
|
Segment Anything in 3D
|
Alias: SegmentAnythingin3D, SA3D |
LivePortrait
|
스티칭 및 리타겟팅 제어를 통한 효율적인 인물 사진 애니메이션 |
Natural Language Processing
Google’s Zero-Label Language Learning Achieves Results Competitive With Supervised Learning
Google AI 연구팀은 자연어 처리에서 제로 레이블 학습(합성 데이터만 사용한 학습)을 탐구하고 인간의 주석 없이 고품질 학습 데이터를 합성하도록 설계된 학습 데이터 생성 절차인 UDG(Unsupervised Data Generation)를 소개합니다. |
Medical
Methodology
Miscellaneous
MMDetection3D
|
3D 객체 탐지. |
Extracting Training Data from Large Language Models
자연어 인공지능 모델 해킹하기
- 구글, 하버드, 스탠포드, OpenAI, 애플이 공동 발표한 논문에 따르면, 큰 언어 모델에 질문하는 것만으로 학습에 사용되었던 구체적인 데이터를 추출해 낼 수 있었다.
- GPT-2를 대상으로 한 공격은 뉴스 헤드라인, 집주소와 같은 개인정보를 아주 높은 정확도로 추출해 냈다.
- 비단 GPT-2 뿐만 아니라 다른 언어 모델도 이런 공격에 취약할 수 있으니 학습 데이터를 전처리하는데 더욱 신경써야 한다
JoJoGan
|
조조 이미지 만들기 - Official PyTorch repo for JoJoGAN: One Shot Face Stylization |
Waifu Labs V2
|
AI가 그리며 커스텀 가능한 일본 애니메이션 스타일 그림 생성기 |
StyleNeRF
|
3D 여러 방향 각도로 이미지 생성 |
Anime BigGAN Toy
|
Generate Amazing Anime Pictures With BigGAN. Just Have Fun |
sahi
|
A lightweight vision library for performing large scale object detection/ instance segmentation. |
Exploiting Diffusion Prior for Real-World Image Super-Resolution (StableSR)
|
Exploiting Diffusion Prior for Real-World Image Super-Resolution |
ReIdentificationNet
|
Enhance Multi-Camera Tracking Accuracy by Fine-Tuning AI Models with Synthetic Data |
MegaSaM
|
MegaSaM - Accurate, Fast and Robust Structure and Motion from Casual Dynamic Videos |
CAT4D
|
CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models |
Graphs
Speech
Playing Games
Time Series
Computer Code
Audio
Robots
Game Engine
Diffusion Models Are Real-Time Game Engines
(대략 DOOM 스샷) |
Real-time recordings of people playing the game DOOM simulated entirely by the GameNGen neural model. |
3D Modeling
Hunyuan3D
|
Tencent의 고해상도 3D Asset 생성 시스템 |
Knowledge Base
Adversarial
Music
Reasoning
TODOs
- https://github.com/chrieke/awesome-satellite-imagery-datasets
- https://github.com/robmarkcole/satellite-image-deep-learning
- 딥러닝의 30가지 적용 사례
- HOYA012'S RESEARCH BLOG - CVPR 2019 overview
- HOYA012'S RESEARCH BLOG - ICLR 2019 image recognition paper list guide
- Mask R-CNN을 이용한 고막 검출 연구 (The semantic segmentation approach for normal and pathologic tympanic membrane using deep learning)
- A collection of pre-trained, state-of-the-art models in the ONNX format
- Github - DeepForest - Python Package for Tree Crown Detection in Airborne RGB imagery
- Github - Machine Learning Collection (Microsoft)
See also
- Deep learning
- Paper to HTML - 논문을 읽기편한 HTML로 변환
Favorite site
- [추천] OpenResearch.ai 1 - 딥러닝 논문이 잘 정리되어 있다.
- [추천] Papers With Code : the latest in machine learning - 페이퍼와 코드를 함께 정리해놓음.
- [강추] Browse the State-of-the-Art in Machine Learning | Papers With Code - 머신 러닝의 최신 기술 목록 및 카테고리별 정리.
- 의학/화학/생물학/인문학/물리학/공학/공학/경제학..
- 출처는 저널 80%, 컨퍼런스 6%, 책 5%
- 77%는 1980~2020년 사이, 36%는 2010~2020년 출판물
Article
- The General Index - 백만개 저널의 n-gram 인덱스를 무료로 공개 | GeekNews
- Unpaywall - 오픈 액세스 논문 검색엔진 | GeekNews
- top-cited-2022-papers.tsv - 2022년에 가장 많이 인용된 AI 논문 100 (3년간 인용 횟수 및 논문 갯수별 순위 : 국가별, 회사별)
- 지난 3년간 탑 5 논문들
- 2022: AlphaFold Protein Structure DB, ColabFold, DALL-E2, ConvNet, PaLM
- 2021: AlphaFold Protein Strecture Prediction, Swin Transformer, CLIP,..
- 2020: Transfomers for Image Recognition, GPT-3, YOLOv4,..
- 지난 3년간 탑 5 논문들
Tools
- Writefull - 학술논문 작성을 도와주는 AI
- Title Generator: 초록(abstract)를 입력하면 제목을 추천
- Abstract Generator: 서론과 결론을 입력하면 초록을 생성
- Paraphraser: 표절 시비를 피하면서 인용할 수 있도록 문장 내용을 바꿔줌
- Academizer: 비 학술적인 표현들로 작성된 문장을 학술적인 표현으로 바꿔줌
- GPT Detector: 특정 문단이 GPT-3, ChatGPT 등의 AI로 생성된 것인지 확인해줌
References
-
Openresearch.ai-190921.zip ↩