HyperAI

Meta-RL غير متصل

التعلم التعزيزي غير المتصل بالإنترنت هو اتجاه بحثي ناشئ يجمع بين التعلم التعزيزي غير المتصل بالإنترنت (Offline RL) والتعلم التعزيزي الفوقي (Meta-RL). تم اقتراح هذا المفهوم لأول مرة في عام 2020 من قبل فريق البحث DeepMind وتم نشره في ورقة بحثية "التعلم التعزيزي غير المتصل بالإنترنت"تم شرحه بالتفصيل في ". ويهدف إلى الاستفادة من البيانات غير المتصلة بالإنترنت (أي البيانات التي تم جمعها مسبقًا ولا تعتمد على التفاعلات عبر الإنترنت) لتدريب النماذج، مما يمكنها من التكيف بسرعة مع المهام الجديدة أو البيئات الجديدة دون الحاجة إلى تفاعلات مكثفة عبر الإنترنت. ويعد هذا النهج مناسبًا بشكل خاص للسيناريوهات التي تكون فيها تكاليف التفاعل عبر الإنترنت مرتفعة أو المخاطر عالية، كما هو الحال في المجالات الطبية والقيادة الذاتية.