Salı , 22 Eylül 2020
Home » Teknoloji » PoseRBPF: 6D Nesne Poz İzleme İçin Yeni Filtre
PoseRBPF: 6D Nesne Poz İzleme İçin Yeni Filtre 1 – poserbpf 6d nesne poz izleme icin yeni bir parcacik filtresi 5dffaa547c2691

PoseRBPF: 6D Nesne Poz İzleme İçin Yeni Filtre

NVIDIA, Washington Üniversitesi, Stanford Üniversitesi ve Illinois Üniversitesi Urbana-Champaign’daki araştırmacılar; son zamanlarda PoseRBPF isminde olan 6D poz takip edeni için Rao-Blackwellized Parçacık Filtresi geliştirdiler. Yaklaşım, bir nesnenin 3D çevirisini ve 3D döndürme üstündeki tam dağılımını etkin bir halde tahmin edebilir. ArXiv’de evvelde gösterilen bu filtreyi tanımlayan yazı; Almanya’nın Freiburg kentinde yapılacak olan Robotik Bilim ve Sistemler Konferansı’nda sunulacak.

Videolardaki nesnelerin 6D pozlarının izlenmesi; manipülasyon ve gezinme görevleri dahil olmak suretiyle çeşitli görevlerde robotların performansını artırabilir. Nesne pozu tahmini için mevcut tekniklerin bir çok; her kamera karesinde bir nesnenin 6D pozu (şu demek oluyor ki xyz çevirisi ve 3D yönü) için tek bir tahmin öngörmeye iş yapmaktadır.
Bu yöntemlerin bazı sınırlamaları ve problemleri vardır. Mesela; kısmen yada tamamen tıkalı nesnelerin pozunu söyleyememektedirler. Dahası, simetriler sebebiyle; bir nesneyi ortaya koymak için tek bir doğru cevabın olmadığı, görevi daha da karmaşıklaştıran durumlar da vardır.

Araştırmacı Arsalan Mousavian: “Günlük ortamlarımızdaki birçok nesnenin yiyecek tabağı, kaseler, şişeler yada küpler şeklinde bakışımlı olduğu ortaya çıktı. Bu nesnelerin benzersiz bir 3D yönü yok. Bundan dolayı birçok değişik bakış açısıyla aynı görünüyorlar. Bu sorunları aşmak ve bir nesnenin pozunun tam dağılımını seyretmek için; (tek poz tahmininin aksine) bir yöntem önerdik. Bu dağıtım; nesnenin pozundaki belirsizliği doğru bir halde yakalar ve vakit içinde kovuşturmak, nesnenin pozunu belirsizleştirmeye destek verir.”

Mousavian ve meslektaşları tarafınca geliştirilen bir yaklaşım olan PoseRBPF; belirli bir kamerayla ilgili olarak, belirli bir nesnenin 6Dpozu (şu demek oluyor ki 3D çevirisi, 3D yönü) üstündeki tam dağılımını izleyebilir. 6D’nin uzayda olasılık dağılımları oldukça karmaşıktır. Bu yüzden doğru şekilde ölçülmezse gerçek zamanlı olarak güncellemek mümkün değildir. İzlenen dağılımların doğruluğunu sağlamak için araştırmacılar; 3 boyutlu nesne çevirisi ve 3 boyutlu nesne yönelimi tahminlerini Rao-Blackwellized Partikül Filtresi isminde olan bir teknik kullanarak ayırdılar.
Mousavian: “Rao-Blackwellized partikül filtresinde, nesne çevirileri örnekler yada partiküller ile temsil edilir ve oryantasyon; 200.000 olası oryantasyona yakın minik parçalara ayrılır. Nesnenin tüm bu oryantasyonlarda ve tadı aydınlatma koşullarında iyi mi görünebileceğini temsil eden yerleştirmeleri evvelde hesaplamak için derin bir öğrenme tekniği kullandık. Son aşama paralel NVIDIA GPU işlemesi avantajından yararlanarak , yaklaşımımız mevcut kamera görüntüsünü bunlarla karşılaştırabilir.”

Her adımda, araştırmacılar tarafınca tasarlanan yaklaşım; nesnenin ve kameranın bir adımdan diğerine iyi mi hareket edebileceğini öngören bir modeli izleyerek ve önceki parçacık grubundan örnekleme yaparak parçacık kümesini güncellemektedir. Bu işlem; PoseRBPF’nin vakit içinde data biriktirmesini sağlar. Bu da daha sağlam ve doğru poz tahminleri sağlar.

PoseRBPF: 6D Nesne Poz İzleme İçin Yeni Filtre 2 – poserbpf 6d nesne poz izleme icin yeni bir parcacik filtresi 5dffaa547c269
Dönme dağılımlarının görselleştirilmesi. Çizgiler, bir eşikten daha yüksek dönüşler için olasılığı temsil eder. Her çizginin uzunluğu, o bakış açısının olasılığı ile orantılıdır. Görülebileceği şeklinde, PoseRBPF organik olarak, kasenin dönme simetrisi, köpük tuğlanın ayna simetrisi ve sağdaki T-LESS nesnelerinin ayrık dönme simetrileri dahil olmak suretiyle çeşitli simetrilerden meydana gelen belirsizlikleri temsil eder. / TechXplore

Çeviri yönelimi tahminine gore, Mousavian ve meslektaşları tarafınca tavsiye edilen seyretme sistemi; 6 boyutlu nesne pozlarının alanı üstündeki karmaşık belirsizlik dağılımlarını etkin bir halde izah edebilir. Çerçeveleri ek olarak; belirli bir nesnenin pozuyla ilgili belirsiz data sağlar ve bunlar robot manipülasyon görevlerinde bilhassa yararlı olabilir. Dahası; sistem bileşik ve açıklamalı olmayan veriler kullanılarak eğitildi, böylece araştırmacılara açıklayıcı verilerde harcanan vakit ve kaynakları koruyabilir.

Mousavian: “Yöntemimiz parçacık filtrelemenin klasik Bayesian tahmin çerçevesini derin öğrenme ile birleştiriyor. Böylece, son on yılda geliştirilen iyi belirlenmiş tahmin tekniklerini ve son derin öğrenme yaklaşımlarının enerjisini bir araya getiriyor. Netice olarak, PoseRBPF; bakışımlı olanlar da dahil olmak suretiyle rasgele nesnelerin pozlarını sağlam bir halde tahmin edebilir.”

Araştırmacılar, iki 6D poz tahmin veri setine yaklaşımlarını değerlendirdi: YCB video veri seti ve T-LESS veri seti… PoseRBPF; öteki poz tahmin tekniklerinden daha iyi performans gösteren en gelişmiş neticeleri elde etti. Gelecekte; Mousavian ve meslektaşları tarafınca geliştirilen parçacık filtresi; mesela nesnelerin manipülasyon kabiliyetlerini artırarak, çeşitli ortamlarda robotların performansını artırabilir.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir