HyperAI초신경

오타쿠들에게 좋은 소식: 레고가 너무 많아도 걱정하지 마세요. 스마트 분류기가 레고를 분류하는 데 도움을 줄 수 있습니다.

5년 전
진짜 가십
神经小兮
特色图像

레고는 이제 고품질 장난감의 대명사가 되었으며, 이 브랜드의 가장 잘 알려진 제품은 레고 블록입니다. 풍부한 모양과 다양한 놀이 방법으로 인해 어른과 아이 모두에게 사랑받고 있습니다. 하지만 이렇게 복잡하고 다양한 부분을 분류하고 보관하는 것은 큰 문제입니다. 한 소프트웨어 엔지니어가 AI 기술을 사용하여 레고 분류 기계를 만들어 레고 매니아들에게 좋은 소식을 전했습니다.

레고를 한 번도 사용해 본 적이 없더라도, 레고에 대해 들어보셨을 겁니다. LEGO 그룹은 1932년 덴마크에서 설립되었으며 그 후 얼마 지나지 않아"레고"이 상표는 고품질 장난감의 대명사가 되었습니다.

1934년, 창립자인 올레 키르크 크리스티안센은 자신의 회사 이름을 "레고"로 지었습니다. 사진은 레고 로고의 변화를 보여줍니다.

레고의 가장 유명한 조립 블록은 1949년에 처음 출시되었습니다. 70년의 역사.

레고를 분류하는 건 얼마나 어렵나요?

레고 블록은 복잡성, 다양성, 그리고 넓은 상상력의 공간으로 인해 아이들에게 매우 매력적입니다. 그들은 많은 플레이어를 사로잡았고 심지어 많은 교육 기관에서 교수 자료로 사용되기도 했습니다. 하지만 레고를 좋아하는 친구들은 부품의 종류가 너무 다양해서 분류와 범주화에 어려움을 겪는 경우가 많습니다. 현재는 다음과 같습니다. 119 시리즈, 111 색상, 각 시리즈에는 다음이 포함됩니다.수백 또는 수천 개의 부품.

한때 어떤 레고 애호가가 eBay 경매에서 레고 블록 2톤을 구매한 적이 있습니다. 돈을 쓰는 건 재밌지만, 레고가 그렇게나 많은 걸 보고는 어리둥절해졌다. 그는 자신의 블로그에 "이 모든 것을 정리하려면 몇 번의 인생이 걸릴 것"이라고 적었습니다.

이 호그와트 성에는 6020개의 건축용 벽돌이 들어 있습니다.

많은 플레이어들이 레고의 분류와 구성에 대한 연구를 수행했습니다. 컴퓨터 비전에 관심이 있는 호주 소프트웨어 엔지니어인 다니엘 웨스트는 이 "어려운" 문제를 AI에 맡겼습니다.

Zhihu 답변자는 레고의 분류 및 구성에 대해 매우 잘 알고 있습니다.

세계 최초의 범용 AI 레고 분류기

인간은 건축 블록을 보는 것만으로도 그 모양, 색상, 기타 특징을 쉽게 파악할 수 있습니다. 예를 들어, 1~2살짜리 어린이도 몇 번 시도해 본 후 2×1 크기의 빨간색 빌딩 블록, 4×1 크기의 초록색 빌딩 블록, 작은 사슬 빌딩 블록의 차이를 구별할 수 있습니다.

하지만 분류와 요약 작업을 기계에 맡기면 어떨까요? 그렇게 간단한 문제는 아닌 것 같습니다.

일찍부터 2011일본의 LEGO 애호가 아키유키, 이 문제를 해결하기 위해 레고 분류 기계를 발명했습니다. 하지만 그의 데이터베이스에는 이미지가 적고 정렬 속도가 느립니다.

아키유키의 2011년 레고 분류기

레고와 기계를 좋아하는 아키유키에게서 영감을 받았습니다.다니엘 웨스트, 호주 소프트웨어 엔지니어  저는 더욱 똑똑하고 빠른 레고 분류 기계를 디자인하고 싶습니다.

그래서 그는 2년을 보냈습니다.10,000개 이상의 레고 블록, 범용 레고 블록 분류기를 만들었습니다. 이 분류기는컴퓨터 비전 알고리즘의 도움으로 모든 레고 부품을 분류할 수 있습니다.. 이 장치에는 레고 부품을 운반하는 컨베이어 벨트와 교반기에 동력을 공급하기 위한 레고 모터 6개와 서보 모터 9개가 장착되어 있습니다.

웨스트는 기계가 가능하다고 말했다2927개의 LEGO 블록을 18개의 다른 상자에 분류하세요,그리고2초마다여러분은 빌딩 블록을 공유할 수 있습니다. 꽤 좋은 효율성이죠?

이것은 세계 최초의 레고 분류 기계는 아니지만 West는 이를 다음과 같이 부릅니다.세계 최초의 범용 레고 분류기"최첨단 인공지능 기술을 사용해 지금까지 생산된 모든 레고 부품을 인식하고 분류할 수 있기 때문입니다." 웨스트는 앞으로 코드를 공개할 계획이기도 합니다.

분류작업은 3단계로 나누어 진행한다

이 유능한 장치는 정확히 어떻게 작동합니까? 전반적으로 복잡해 보이지 않으며 총 3단계로 구성되어 있습니다.

1단계: 블록을 추가합니다.

많은 양의 레고를 기계 위쪽의 투입구에 붓고, 벽돌을 진동 벨트 위에 올려놓고, 이를 흔들어 개별 조각으로 쪼갠다.

2단계: 사진을 찍고 분류합니다.

블록은 Raspberry Pi 컴퓨터를 통해 전달됩니다. Raspberry Pi 컴퓨터에는 벽돌이 지나갈 때 일련의 사진을 찍는 카메라가 내장되어 있으며, 이 사진은 CNN 모델에 입력됩니다. 레스넷-50  분류하다.

3단계: 분류하여 상자에 담기

분류 결과가 장치로 다시 전달되면, 컨베이어 벨트에 있는 여러 개의 작은 문이 빌딩 블록을 해당 상자로 안내합니다. 

기술적 구현에는 우여곡절이 있습니다.

레고 부품은 수백 가지 종류가 있으며, 색상도 다양하고, 각도에 따라 모양이 다릅니다. 그러므로,올바른 훈련 데이터 세트를 수집하는 것은 전체 작업 중 가장 어려운 부분입니다..

다니엘 웨스트는 처음에 며칠 동안 장치를 작동시켰습니다.,우리는 약 30만 개의 라벨이 없는 LEGO 이미지를 수집했습니다.

웨스트는 처음에는 레고로 시뮬레이션하려고 했다고 말했습니다. 그는 ~에서 LDraw 파트 라이브러리(레고를 가상으로 조립할 수 있는 오픈 소스 프로그램) 3D 모델무료 애니메이션 소프트웨어 Blender를 사용하여 렌더링했습니다.

이 사람은 또한 트위터에서 AI 모델을 훈련하는 데 사용한 3D 렌더링 이미지의 예를 보여주었습니다.

그런 다음 3D 모델 블록을 다양한 회전 각도와 색상으로 시뮬레이션할 수 있습니다. 이러한 개별 이미지는 다음과 같이 수집됩니다.2500만 개 이상의 이미지합성 데이터 세트.

그러나 웨스트의 실망에,그의 AI 레고 분류기는 가짜 이미지로 훈련되었지만 실제 부품을 인식하지 못했습니다.. 그는 "그 당시 저는 그 프로젝트를 완전히 포기할 뻔했습니다"라고 말했습니다. "저는 합성 이미지를 실제 이미지로 변환하는 복잡한 방법을 구현하는 데 몇 달을 보냈지만 별 성과가 없었습니다."

그런 다음 그는 시뮬레이션과 현실 사이의 격차를 줄이는 데 도움이 되는 또 다른 일반적으로 사용되는 기술을 사용했습니다.도메인 무작위화.

도메인 무작위화를 통해 모델이 더 많은 데이터 변형을 인식하도록 훈련할 수 있습니다.이 시스템은 레고 블록의 회전과 색상을 다르게 학습할 뿐만 아니라, 다양한 조명 효과, 질감, 노이즈를 고려하는 법도 학습했습니다..

West는 Lego 분류기의 성능을 더욱 개선하기 위해 실제 Lego 부품의 스냅샷을 포함하는 더 작은 데이터 세트도 통합했습니다. 그는 "실제 데이터 세트에는 내 개인 컬렉션에 있는 작품만 포함되어 있었는데, 총 544가지 유형의 작품이 포함되었습니다."라고 말했습니다. 이는 레고 시리즈에서 흔히 발견되는 유형이고, 합성 데이터 세트는 덜 흔한 유형을 위한 것입니다.

다니엘 웨스트의 레고 분류 기계는 높이가 약 80cm이고 분류통이 18개 들어 있습니다.

이 두 가지 데이터 세트를 기반으로 학습을 실시하면, 이론적으로는 West의 레고 분류기에 장착된 카메라가 실제로 본 적이 없는 부분까지 인식할 수 있을 것입니다. 그러나 다양한 데이터 세트에 대한 모델의 실제 성능은 여전히 다릅니다.실제 데이터 세트부품이 있을 때 93%, 및 식별합성 데이터 세트부품의 정확도 74%.

훈련 데이터 세트를 수집하는 것은 쉽지 않으며 West도 기사를 썼습니다. (원본 링크: http://985.so/f5G8)그는 10만 개의 라벨이 붙은 LEGO 훈련 이미지를 만든 과정을 자세히 설명했습니다. 해당 기사에서는 그가 주로 샘플 생성 방법을 사용하고, 프로세스를 간소화했으며, AI 지원 주석을 사용하여 방대한 이미지에 레이블을 지정하는 작업을 완료했다고 언급했습니다.

AI의 도움으로 꿈이 현실이 됩니다

웨스트는 레고를 좋아하고, 그의 꿈 역시 레고와 관련이 있습니다. 그는 말했다,그는 마침내 평생의 꿈인 실제 작동하는 레고 분류 기계를 만드는 것을 실현하게 됩니다.인공지능 시스템을 설계하고 배포하는 실제 경험을 얻습니다.

Daniel West의 YouTube 게시물은 모두 레고에 관한 것입니다.

관심은 최고의 스승이자 가장 큰 원동력입니다. 동시에 기술의 발전은 관심과 꿈을 증폭시켜 크고 작은 꿈을 보다 빠르고 완벽하게 실현할 수 있게 되었습니다. 요즘에는 AI가 레고를 분류하는 데 도움을 줄 수 있는데, 그러면 AI가 할 수 없는 다른 일도 있을까요?

-- 위에--