Hongkong-baserade DAIMON Robotics har nyligen presenterat Daimon-Infinity, världens största flermodala dataset för fysisk AI. Det omfattar högupplöst känseldata och täcker en bred skala av uppgifter – från att vika tvätt i hemmet till precisionsarbete på fabriksgolv.

Projektet drivs i samarbete med flera internationella partners, däribland Google DeepMind, Northwestern University och National University of Singapore. Satsningen markerar en strategisk milstolpe för DAIMON, ett företag som under sina två och ett halvt år har specialiserat sig på avancerad känselteknik för robotar.

Företagets mest uppmärksammade innovation är en monokrom, visionsbaserad känselsensor som rymmer över 110 000 effektiva sensorenheter i en fingertopp. Genom att kombinera denna höguplösta känselteknik med ett distribuerat datainsamlingssystem – som kan generera miljontals timmar data årligen – bygger DAIMON upp stora dataset för robotmanipulation. För att snabba på implementeringen av kroppslig AI har företaget även valt att öppet tillgängliggöra 10 000 timmar av sin data.

Bakom denna strategi står professor Michael Yu Wang, medgrundare och chefsforskare på DAIMON Robotics. Professorn, som har en doktorsexamen från Carnegie Mellon University och grundade Robotikinstitutet vid Hongkongs universitet för vetenskap och teknik, har ägnat nära fyra decennier åt robotikforskning. Hans mål är att lösa den avgörande bristen på känsel i dagens robotmanipulation, som i stor utsträckning bygger på Vision-Language-Action (VLA)-modellen.

Tillsammans med sitt team har han utvecklat Vision-Tactile-Language-Action (VTLA)-arkitekturen, som lyfter fram känsel som en jämställd sensorisk modalitet bredvid synen.

Känseln som nyckeln till smidigare robotar

Under ett samtal med professor Wang diskuterade vi hur känselåterkoppling kan revolutionera robotars förmåga att hantera föremål med precision. Vi berörde även hur Daimon-Infinity förväntas förbättra förståelsen för robotarmars funktion i verkliga miljöer – från hotellverksamhet till kinesiska butiker.

Daimon-Infinity är inte bara det största flermodala datasetet för fysisk AI, utan innehåller även:

  • Data i miljoners timskala med multimodal information
  • Ultrahögupplöst känselåterkoppling
  • Insamling från över 80 verkliga scenarier
  • Över 2 000 mänskliga färdigheter dokumenterade

Varför öppet tillgängliggöra data?

DAIMON Robotics har under sina två och ett halvt år fokuserat på att utveckla robusta känselenheter för robotfingrar. Deras sensorer används redan av forskningsinstitut och ledande humanoida robotikföretag världen över.

När vi frågade varför man valt att släppa datasetet nu, i stället för att fortsätta utveckla produkterna, framhöll professor Wang den avgörande roll som data spelar för utvecklingen av kroppslig AI. ”Känsel är den avgörande faktor som saknas för att robotar ska kunna hantera komplexa uppgifter med den precision och anpassningsförmåga som krävs i verkliga miljöer.”