AI-Toolbox/MDP_2Policies_2QGreedyPolicy_8hpp_source.html

#ifndef AI_TOOLBOX_MDP_Q_GREEDY_POLICY_HEADER_FILE

#define AI_TOOLBOX_MDP_Q_GREEDY_POLICY_HEADER_FILE


#include <AIToolbox/MDP/Policies/QPolicyInterface.hpp>


namespace AIToolbox::MDP {

    class QGreedyPolicy : public QPolicyInterface {

        public:

            QGreedyPolicy(const QFunction & q);


            virtual size_t sampleAction(const size_t & s) const override;


            virtual double getActionProbability(const size_t & s, const size_t & a) const override;


            virtual Matrix2D getPolicy() const override;


        private:

            // To avoid reallocating a vector every time for sampling.

            mutable std::vector<size_t> bestActions_;

    };

}


#endif