Paper Review8 [논문리뷰] : Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 논문 요약 정리 "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks"는 2015년에 발표된 중요한 딥러닝 논문으로, 객체 인식 분야에서 매우 영향력 있는 연구입니다. 이 논문은 이전의 R-CNN과 Fast R-CNN을 발전시킨 모델로, 실시간 객체 탐지에 중점을 둡니다. 여기에 대한 주요 내용을 정리해드리겠습니다. 1. 배경 및 도입 R-CNN과 Fast R-CNN의 한계: 이전 모델들은 높은 정확도를 제공하지만, 속도 면에서 느린 문제가 있었습니다. 특히, 객체 후보 영역을 생성하는 과정(Region Proposal)이 속도 저하의 주된 원인이었습니다. 목표: Faster R-CNN은 이러한 속도 문제를 개선하고.. 2024. 1. 23. Detecting Illumination in Images 여러 광원이 존재하는 경우, 많은 이미징 알고리즘은 좋지 않은 결과를 낳는다.(tracking, scene analysis, object recognition, illuminant estimation) 그래서 이 논문에서는 그림자에 집중하며, chromagneic camera와 combination detection 기법을 이용한 조명 감지 방법을 제시한다. 조명이 2,3개 일 경우 제일 좋은 성능을 보이나, 그 이상일 경우 성능이 좋지 못하다. → 좋은 알고리즘일 것이라 생각되었으나, Cromagenic camera가 필요하다는 점 때문에 일반적인 상황에서 적용하기는 어려울 것 같다. Abstract 이 논문은 chromagenic camera와 combination detection 기법을 사용하여 .. 2023. 10. 17. RINDNet: Edge Detection for Discontinuity in Reflectance, Illumination, Normal and Depth : 논문 리뷰 3줄 요약 4가지 유형의 Edge(에지) Reflectance, Illumination, Normal, Depth(반사율, 조명, 정상 및 깊이)를 공동으로 감지하기 위한 새로운 신경망 솔루션인 RINDNet을 제안한다. 제안된 방법은 세 단계로 작동하며 어텐션 모듈을 사용하여 에지 유형 간의 기본 관계를 캡처한다. 실험 결과는 RINDNet이 최첨단 에지 감지 알고리즘과 비교하여 유망한 결과를 낳는다는 것을 보여준다. 따라서 이 논문은 RINDNet이 네 가지 유형의 에지를 모두 동시에 감지하는 효과적인 솔루션이라고 결론지었다. → 논문에서 두 명의 라벨링(주석처리자)가 필요하고, 정말 섬세한 작업을 요한다고 한다. 기본적으로 모델 학습시에 라벨링이 필요하기는 하지만 공수가 클 것으로 보인다. Abst.. 2023. 10. 16. A NO-REFERENCE EVALUATION METRIC FOR LOW-LIGHT IMAGE ENHANCEMENT : 논문 리뷰 3줄 요약 저조도 환경에서 촬영된 사진을 기존의 다양한 low-light image enhancement algorithms(LIEAs)를 사용하였을 경우, 어두운 부분에서의 숨겨진 왜곡이 강조되거나 새로운 왜곡이 생기는 문제점이 발생. 또한 light enhancement를 한 경우에 대한 IQA metrics가 출판하였을 경우까지 존재하지 않았음. 그래서 No-reference low-light image enhancement evaluation(NLIEE) 방법을 제안한다. 이 방법은 광강화, 색상 비교, 노이즈 측정, 구조 평가의 4가지 측면에서 주로 18개의 특징을 추출한다. 이러한 NLIEE 방법은 LIEQ 데이터셋에서 평가하였을 때, 광각화 부분에 있어서 NR-IQA 및 quality des.. 2023. 10. 15. Gabor 웨이블릿 기반 객관적 화질 평가 정확한 화질 평가 방법의 필요성이 생김에 따라, 기존의 MSE, PSNR 방식은 HVS의 가시도 혹은 인지 특성을 고려하지 못한다는 문제점을 제시한다. 따라서 HVS 인지 특성을 고려하여 수용계의 수학적 모델인 Gabor 웨이블릿을 이용한 객관적인 화질 평가 방법을 제안한다. 제안된 방법은 주관적 점수와 높은 상관관계를 갖는 우수한 객관적 화질 평가 모델로서, 기존의 방법보다 우수한 성능을 보여준다.(특히 625/50) DSCQS(Double Stimulus Continuous Quality-Scale) : 순서는 상관없이 원본 영상과 왜곡 영상을 일정한 간격을 두어 두 번씩 보여준 후, 두 번째 마지막 영상이 보여질 때 “Excellent”, “Good“, “Fair“, “Poor“, “Bad“의 5단.. 2023. 10. 14. Perceptual quality evaluation of geometrically distorted images using relevant geometric transformation modeling : 3줄 요약 사진의 워터마크에 관련하여 사진이 왜곡될 시, 워터마크인식이 안되는 점 그리고 왜곡된 사진에 대한 객관적인 VQA가 부족하다는 문제점. 이를 위해 RST(rotation, scaling and translation)/Affine transform 방법으로 기하학적 왜곡을 정량화하고, 왜곡된 사진에 대한 품질 평가를 진행한다. 그리고 아직 해결하지 못한 문제점들, 과제들은 언급한다. 2023. 10. 13. Uniform Motion Blur Removal Algorithm with a Single Image using Convolutional Neural Network : 논문 요약 [3줄 요약] 단일 이미지로부터 균일한 모션 블러를 제거하는 알고리즘을 제안한다. 이를 위해 컨볼루션 신경망을 사용하여 이전 연구들에서 발견된 제안 사항을 통합하고 개선하였다. 실험 결과, 제안된 알고리즘이 기존 알고리즘에 비해 더 나은 결과를 제공함을 보여주었다. CNN을 이용한 모델로 원본 이미지 1개와 8개 종류의 커널로 블러시킨 이미지 8개를 가지고 원본 이미지를 정답 레이블로 하여 학습시켜 디블러링을 할 수 있는 커널을 구해냈다. 실제로 PSNR, SSIM 방식으로 결과 비교 값도 높은 수준인 것을 확인할 수 있었다. 그 커널을 이미지에 적용했더니 확실히 개인적인 느낌이지만 원본 이미지와 흡사할 정도로 선명해진 것을 확인할 수 있었다. 기타 더 상세한 사항까지 정리하기에는 굳이? 라는 생각이 들.. 2023. 10. 13. Batch Normalization(2015) 논문 리뷰 Batch Normalization(2015) [3줄요약] 각 미니배치 학습마다 정규화를 진행함으로써, 내부 공변량 변화에 대응하고 학습시, 더 높은 학습률을 사용할 수 있다는 점과, 가중치 초기화에 덜 신경을 쓸 수 있고 BN을 사용하면 Dropout을 사용하지 않아도 되는 장점이 있다. 또한 아무 optimizer를 사용할 수 있다는 장점도 존재하여 이미지 관련 모델에서 상당히 큰 차이로 높은 성능을 나타낸다. 1. Introduction SGD 는 간단하고, 효과적이지만 학습률과 같은 하이퍼파라미터, 모델 파라미터의 초기값 튜닝에 신경을 많이 써야한다. 또한 이전 레이어가 다음 레이어에 영향을 많이 주기 때문에 학습이 어렵다. 그러므로 모델이 깊어질 수록 조그만한 변화가 큰 변화를 만들어낸다. 이를.. 2023. 8. 6. 이전 1 다음 728x90