このデータセットは、ユーザーとオペレーター間のオーディオビジュアルインタラクションをキャプチャするビデオ データセットです。オペレーターは、ポピー (幸せ)、オバディア (憂鬱)、スパイク (怒り)、プルーデンス (慎重) の 4 つの性格を持つキャラクターを演じます。ビデオは 25 fps (352 x 288 ピクセル) で記録され、ビデオ クリップは一貫性、関心、決意、集中、思慮深いなどのいくつかの状態に注釈が付けられ、[-1,1] の範囲で継続的に評価されます。ここで、-1最低の評価がまったく注目されていないことを意味し、+1 は最高の評価が最も注目されていることを意味します。
Solid SAL シナリオでは 24 の記録セッションが使用され、記録はユーザーとオペレーターの 2 つの部分で構成され、通常、各記録には 4 つのキャラクター インタラクションがあり、合計 95 のキャラクター インタラクションと 190 のビデオ クリップが提供されます。