uwenku
टैग सूची
planning
8
गर्मी
2
उत्तर
सुदृढीकरण सीखना चर क्रिया
सभी reinforcement learning एल्गोरिदम के बारे में मैं आमतौर पर एक एजेंट कार्यों की एक निश्चित संख्या है पर लागू होते हैं पढ़ा है के साथ। क्या कार्यवाही की एक चरम संख्या को ध्यान में रखते हुए निर्णय लेन
machine-learning
reinforcement-learning
planning
2011-03-07
नवीनतम प्रश्न
1.
मैं उबंटू
2.
कतार
3.
फेसबुक इन रीडायरेक्ट्स को कैसे कर रहा है?
4.
विजुअल स्टूडियो गटर विंडो में अजीब तीर
5.
स्प्रिंग @ ट्रान्सैक्शनल (प्रचार = प्रचार। सपोर्ट्स) का उपयोग कब करें?
6.
नेटबीन लाइसेंस टेम्पलेट में $ {project.organization} को नहीं पहचानता
7.
प्रॉक्सी क्लाइंट पोस्ट और PUT अनुरोधों को रिवर्स कैसे करें node-http-proxy
8.
एक वेक्टर कॉपी कब किया जाता है, एक संदर्भ कब पास किया जाता है?
9.
Lucene और एसक्यूएल सर्वर - सबसे अच्छा अभ्यास
10.
क्यों आंतरिक एचटीएमएल काम नहीं करता