İnsanların Nereye Yöneldiğini Robotlara Anlatan Algoritma
2018’de MIT’deki araştırmacılar ve otomobil üreticisi BMW, otomobil parçalarının monte edilmesinde insanların ve robotların çalışabileceği yerleri test ediyorlardı. Fabrika zemini ayarının bir kopyasında, ekip; iş istasyonları arasında parça teslim etmek üzere tasarlanmış raylara bir robot yerleştirdi. Bu arada, insan işçiler; yakındaki istasyonlarda çalışmak için her zaman robotların önlerine geçtiler.
Robot, bir kişiyi geçerse anlık olarak durması için programlandı. Ancak araştırmacılar, robotun; kişinin yoluna geçmeden çok önce, dikkatli bir şekilde yerinde duracağını fark etti. Bu, gerçek bir üretim alanında gerçekleştiyse, gereksiz duraklamalar önemli verimsizliklere neden olabilirdi.
Ekip; sorunu robotun hareket öngörme yazılımı tarafından kullanılan, robotun yörünge hizalama algoritmalarındaki bir sınırlamaya kadar takip etti. Bir kişinin nereye yönlendirileceğini makul bir şekilde tahmin edebiliyor olsalar da; (zayıf zaman uyumu nedeniyle) algoritmalar; o kişinin öngörülen yol boyunca herhangi bir noktada ne kadar zaman harcadığını tahmin edemezdi.
MIT ekibinin üyeleri bir çözüm ürettiler: Kısmi yörüngeleri gerçek zamanlı olarak doğru şekilde hizalayan ve hareket tahmincilerin bir kişinin hareketinin zamanlamasını doğru bir şekilde öngörmesini sağlayan bir algoritma… Yeni algoritmayı BMW fabrikasında; deneylerde uyguladıklarında, donma-durma yerine; robotun basitçe yuvarlandığını ve kişinin tekrar yürüdüğü zaman güvenli bir şekilde devre dışı kaldığını buldular.
MIT Havacılık ve Astronomi Profesörü Julie Shah: “Bu algoritma, bir robotun insan hareketinin; temel bir parçası olan hareketin durmasını ve çakışmasını anlamasına ve izlemesine yardımcı olan bileşenlerden oluşur. Bu teknik; insanları daha iyi anlamak için robotlar üzerinde çalıştığımız birçok yöntemden biridir.”
Kümelenmiş
Robotların insan hareketlerini tahmin etmesini sağlamak için araştırmacılar; genellikle müzik ve konuşma işlemlerinden algoritmalar alırlar. Bu algoritmalar; iki tam zaman serisini veya bir müzikal performansın ses kaydı ve o parçanın müzik notasının kayan bir videosu gibi; ilgili veri kümelerini hizalamak üzere tasarlanmıştır.
Araştırmacılar; gerçek zamanlı ve daha önce kaydedilen insan hareketi ölçümlerini senkronize etmek, bir insanın şimdiki zamandan beş saniye sonra nerede olacağını tahmin etmek için benzer hizalama algoritmaları kullandılar. Ancak; müzik veya konuşmadan farklı olarak, insan hareketi dağınık ve değişken olabilir. Cıvatayı vidalamak için bir masanın üzerinden ulaşmak gibi tekrarlayan hareketlerde bile; kişi her seferinde biraz farklı hareket edebilir.
Mevcut algoritmalar tipik olarak; bir insanın zaman içindeki konumunu temsil eden noktalar biçiminde akış hareket verilerini alır ve bu noktaların yörüngesini verilen senaryo için ortak yörüngelerin bir kütüphanesiyle karşılaştırır. Algoritma, bir yörüngeyi noktalar arasındaki bağıl mesafe açısından eşler.
Ancak Lasota; yalnızca mesafeye dayalı yörüngeleri tahmin eden algoritmaların, bir kişinin yoluna devam etmeden önce duraksadığı geçici duraklamalar gibi bazı genel durumlarda kolayca karşılaşabileceğini söylüyor. Duraklatıldığında, kişinin konumunu temsil eden noktalar aynı noktada toplanabilir.
Lasota: “Verilere baktığınızda, bir kişi durduğunda bir araya getirilmiş bir sürü noktanız var. Hizalama metriniz olarak yalnızca noktalar arasındaki mesafeye bakıyorsanız, bu kafa karıştırıcı olabilir, çünkü hepsi birbirine yakındır ve hangi noktaya uyum sağlamanız gerektiğine dair iyi bir fikriniz yoktur.”
Aynı durum çakışan yörüngelere de gider – bir kişinin benzer bir yol boyunca ileri geri hareket ettiği durumlardır. Lasota, bir kişinin mevcut pozisyonunun bir referans yörüngesinde bir nokta ile aynı hizada olmasına rağmen; mevcut algoritmaların bu pozisyonun bir yörüngenin parçası olup olmadığı veya aynı yol boyunca geri dönüp dönmeyeceği arasında ayrım yapamayacağını söylüyor.
Lasota: “Mesafeler açısından birbirine yakın noktalara sahip olabilirsiniz, ancak zaman açısından, bir kişinin konumu aslında bir referans noktasından uzak olabilir.”
Hepsi zamanlamada…
Çözüm olarak, Lasota ve Shah; bir kişinin yörüngesinin bölümlerini gerçek zamanlı olarak daha önce toplanan referans yörüngelerin bir kütüphanesiyle hizalayan, bir “kısmi yörünge algoritması” geliştirdi. Önemli olarak, yeni algoritma hem mesafedeki hem de zamanlamadaki yörüngeleri hizalar ve böyle yaparak bir kişinin yolundaki duraklamaları ve örtüşmeleri doğru bir şekilde tahmin edebilir.
Ekip; algoritmayı iki insan hareketi veri setinde test etti: Biri fabrikada; bir robotun aralıklı olarak önüne geçtiğinde (bu veriler ekibin BMW ile yaptığı deneylerden elde edildi) ve grubun daha önce katılımcıların el hareketlerini kaydettiğinde; robotun daha sonra cıvata üzerine sızdırmazlık maddesi fırçalayarak sıkılaştıracağı bir cıvata takmak için masanın karşısına geçerek…
Her iki veri kümesi için de; takımın algoritması, yaygın olarak kullanılan iki kısmi yörünge hizalama algoritmasına kıyasla, bir kişinin yörünge boyunca ilerleyişini daha iyi tahmin edebildi. Ayrıca, ekip; hizalama algoritmasını hareket tahminleriyle birleştirdiklerinde, robotun bir kişinin hareketinin zamanlamasını daha doğru tahmin edebileceğini buldu. Örneğin fabrika zemini senaryosunda; robotun yerde donmaya daha az eğilimli olduğunu gördüler. Biri önüne geçtikten kısa bir süre sonra ;sorunsuz bir şekilde görevine devam etti.
Algoritma; hareket tahmini bağlamında değerlendirilirken, eylem tanıma ve hareket algılama gibi insan-robot etkileşimi alanındaki diğer teknikler için ön işleme adımı olarak da kullanılabilir. Shah, algoritmanın; robotların insan hareketleri ve davranış kalıplarını tanımalarını ve bunlara cevap vermelerini sağlamada kilit bir araç olacağını söyledi. Sonuçta, bu durum insanların ve robotların fabrika ayarları ve hatta bazı durumlarda ev gibi yapılandırılmış ortamlarda birlikte çalışmasına yardımcı olabilir.
Shah: “Bu teknik; insanların tipik davranış kalıpları sergilediği her ortama uygulanabilir. Önemli olan, (robotik) sistemin tekrar tekrar meydana gelen modelleri gözlemleyebilmesi ve böylece insan davranışı hakkında bir şeyler öğrenebilmesidir. Bunların hepsi robotun işinin içinde, insan hareketini daha iyi anlayabilmemiz, bizimle daha iyi işbirliği yapabilmemiz için… ”