Loading...

ÇмúÇà»ç

Korean AI Association

ÇмúÇà»ç
2019³â °­È­ÇнÀ (Reinforcement learning) ÇÏ°è´Ü±â°­ÁÂ

  >   ÇмúÇà»ç   >   ±¹³»Çмú´ëȸ

±¹³»Çмú´ëȸ

ÃÊ´ëÀÇ ±Û
  ÀΰøÁö´ÉÀº »óȲÀ» º¸°í ´À³¤ ÈÄ ±× ´À³¦À» ¹ÙÅÁÀ¸·Î Ãß·ÐÀ» ÇÏ°í, À̸¦ ±â¹ÝÀ¸·Î ÇൿÀ¸·Î ¿Å±â°í ±× ´É·ÂÀ» ´Ù¸¥ ºÐ¾ß¿¡ ÀÀ¿ëÇÏ´Â ºÐ¾ß¶ó°í º¼ ¼ö Àִµ¥ Çൿ°ú °ü·ÃµÈ ºÐ¾ß¸¦ °­È­ÇнÀ (reinforcement learning)À̶ó ÇÕ´Ï´Ù. ÃÖ±Ù¿¡ ÀÌ ºÐ¾ß¿¡ Çõ½ÅÀûÀÎ ¹ßÀüÀÌ ÀÖ¾î ÀÚÀ²ÁÖÇà, ·Îº¿ÇнÀ, 꺿 ¼­ºñ½º, ½Ç½Ã°£ Åë¹ø¿ª µî°ú °°ÀÌ ICT´Â ¹°·Ð ±ÝÀ¶, ÀÇÇÐ ºÐ¾ß¿¡¼­ ½ÇÇè½Ç ´Ü°è¿¡ ¸Ó¹°·¯ ÀÖ´ø ¸¹Àº ³­Á¦µéÀÌ ÇØ°á µÉ¼ö ÀÖ´Â °¡´É¼ºÀÌ ¿­¸®°Ô µÇ¾ú½À´Ï´Ù.
 
  º» ´Ü±â °­Á¿¡¼­´Â ¼¼°è ÃÖ°í Àü¹®°¡ 4ºÐÀ» ¸ð½Ã°í °­È­ÇнÀÀÌ ½ÇÀü¿¡ ÁÁÀº ¼º´ÉÀ» º¸À̱â À§ÇÑ ÀÌ·Ð (reinforcement learning with generalization), ¸ðµ¨ ±â¹Ý °­È­ÇнÀ À̷аú µ¿Çâ,  °­È­ÇнÀ°ú ÇÔ²² ÃÖ±Ù °¢±¤À» ¹Þ´Â ÃÖÀû Á¦¾î ±â¹ý model predictive control, ±×¸®°í ·Îº¿ ÇнÀÀ» »ìÆì º¸µµ·Ï ÇÏ°Ú½À´Ï´Ù. À̹ø ´Ü±â°­Á´ °­È­ÇнÀÀ» È°¿ëÇÑ Çõ½ÅÀûÀÎ ½ºÅ¸Æ®¾÷ â¾÷°ú AI Challenge µµÀüÀ» ÁغñÇÏ°í ÀÖ´Â Çлý ¹× ÀϹÝÀÎÀ» À§ÇØ ÇÊ¿äÇÑ ±â¼ú ¹æÇâÀ» ÇÔ²² ¸ð»öÇÏ´Â ÀÚ¸®°¡ µÉ °ÍÀ¸·Î È®½ÅÇϸç, Âü¼®ÇÏ´Â ¸ðµç ºÐµé²² ¶æ ±íÀº ÀÚ¸®°¡ µÉ °ÍÀ» ±â´ëÇÏ´Â ¸¶À½À¸·Î ¿©·¯ ´ëÇÐ, ÀϹÝÀÎ, »ê¾÷°è ¿©·¯ºÐÀ» ÃÊ´ëÇÕ´Ï´Ù.
 
 º» ´Ü±â°­Á¸¦ ÅëÇØ ±ÍÁßÇÑ ½Ã°£À» ³»¾îÁֽŠ¹ßÇ¥ÀÚ¿Í Âü¼®ÀÚ ¿©·¯ºÐ °¨»çµå¸®¸ç, Àû±ØÀûÀÎ Âü¿©¿Í ¹ßÇ¥, Åä·ÐÀ» ÅëÇØ »ýµ¿°¨ ÀÖ´Â ´Ü±â°­Á°¡ µÉ ¼ö ÀÖµµ·Ï ¸¹Àº ÇùÁ¶ ºÎŹ µå¸³´Ï´Ù. °¨»çÇÕ´Ï´Ù.