Development Tip

이미지에서 로고 인식

yourdevel 2020. 12. 25. 10:32
반응형

이미지에서 로고 인식


이미지의 로고 인식에 대한 최근 학술 연구를 아는 사람이 있습니까? 이 특정 주제에 대해 잘 알고있는 경우에만 답변 해주십시오 (Google에서 "로고 인식"을 직접 검색 할 수 있습니다. 감사합니다). 컴퓨터 비전에 대해 잘 알고 있고 물체 인식에 대한 작업을 해본 사람이라면 누구나 댓글을 달 수 있습니다.

업데이트 : 기술적 인 측면 (사용 된 프로그래밍 언어 또는 사용 된 프로그래밍 언어)이 아닌 알고리즘 측면 (적절하다고 생각하는 접근 방식, 현장의 문서, 실제 데이터에 대해 작동 (및 테스트)되었는지 여부)을 참조하십시오. OpenCV를 사용했는지 여부 ...) 이미지 인덱싱 및 콘텐츠 기반 이미지 검색 작업도 도움이 될 수 있습니다.


여기에서 SIFT와 같은 로컬 기능을 사용해 볼 수 있습니다. http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

일반적으로 로고 모양이 일정하기 때문에 작동해야하므로 추출 된 기능이 잘 일치해야합니다.

워크 플로는 다음과 같습니다.

  1. 모서리 감지 (예 : Harris 모서리 감지기)-Nike 로고의 경우 두 개의 날카로운 끝이 있습니다.

  2. 계산 설명자 (예 : SIFT-128D 정수 벡터)

  3. 훈련 단계에서 그들을 기억하십시오. 매칭 단계에서 훈련 중에 얻은 데이터베이스의 모든 특징에 대해 가장 가까운 이웃을 찾습니다. 마지막으로 일련의 일치 항목이 있습니다 (일부는 틀린 것일 수 있습니다).

  4. RANSAC을 사용하여 잘못된 매치를 시드하십시오. 따라서 이상적인 로고 이미지에서 로고를 찾은 위치로의 변환을 설명하는 매트릭스를 얻을 수 있습니다. 설정에 따라 다양한 종류의 변환 (변환, 변환 및 회전, 아핀 변환)을 허용 할 수 있습니다.

Szeliski의 책에는 지역 기능에 대한 장 (4.1)이 있습니다. http://research.microsoft.com/en-us/um/people/szeliski/Book/

추신

  1. 예를 들어 모든 펩시 광고판을 찾아서 사진에서 로고를 찾고 싶어서 왜곡 될 수 있다고 가정했습니다. 화면에서 TV 채널 로고를 찾아야한다면 (회전 및 크기 조정이되지 않도록) 더 쉽게 할 수 있습니다 (패턴 일치 등).

  2. 기존 SIFT는 색상 정보를 고려하지 않습니다. 로고는 일반적으로 일정한 색상을 갖기 때문에 (정확한 색상은 번개와 카메라에 따라 다름) 어떻게 든 색상 정보를 고려할 수 있습니다.


실제 이미지에서 로고 감지 / 인식 작업을했습니다. 또한 FlickrLogos-32 데이터 세트를 생성하여 데이터, 실측 정보 및 평가 스크립트를 포함하여 공개적으로 사용할 수 있도록했습니다.

우리의 작업에서 우리는 로고 인식을 검색 문제로 취급하여 다중 클래스 인식을 단순화하고 이러한 시스템을 많은 (예 : 수천) 로고 클래스로 쉽게 확장 할 수 있도록했습니다.

최근에 우리 는 여러 로컬 기능의 공간 구성을 매우 독특한 기능 번들로 집계하는 Bundle min-Hashing 이라는 번들링 기술을 개발했습니다 . 번들 표현은 검색과 인식 모두에 사용할 수 있습니다. 로고 감지에 대한 다음 예제 히트 맵을 참조하세요.

여기에 이미지 설명 입력 여기에 이미지 설명 입력

내부 운영, 접근 방식의 잠재적 응용, 성능 실험 및 관련 작업에 대한 많은 참고 문헌에 대한 자세한 내용은 논문 [1] [2]에서 찾을 수 있습니다.


작업 : 스포츠 비디오 데이터베이스의 상표 일치 및 검색은 다음 문서의 PDF를 얻습니다. http://scholar.google.it/scholar?cluster=9926471658203167449&hl=ko&as_sdt=2000

SIFT를 상표 및 이미지 설명 자로 사용하고 정규화 된 임계 값 일치를 사용하여 모델과 이미지 사이의 거리를 계산했습니다. 우리의 최근 연구에서 우리는 동일한 상표의 다른 버전에 존재하는 SIFT 포인트의 관련성을 평가하는 메타 모델을 사용하여 계산을 크게 줄일 수있었습니다.

일반적으로 비디오 작업은 현재 사용되는 TV 표준의 시각적 품질이 매우 나쁘기 때문에 사진 작업보다 어렵습니다.

마르코


저는 우리가 매우 비슷한 일을해야하는 프로젝트에서 일했습니다. 처음에는이 소프트웨어를 사용하여 Haar Training 기술을 사용해 보았습니다.

OpenCV

효과가 있었지만 우리의 요구에 맞는 최적의 솔루션은 아니 었습니다. 소스 이미지 (로고를 찾고 있던 위치)는 고정 된 크기 였고 로고 만 포함했습니다. 이 때문에 우리는 좋은 일치가 알려진 cvMatchShapes를 사용하고 반환 된 값을 비교하여 좋은 일치로 간주 할 수있었습니다.

참조 URL : https://stackoverflow.com/questions/2074956/logo-recognition-in-images

반응형