AI-Toolbox/MDP_2Policies_2EpsilonPolicy_8hpp_source.html

#ifndef AI_TOOLBOX_MDP_EPSILON_POLICY_HEADER_FILE

#define AI_TOOLBOX_MDP_EPSILON_POLICY_HEADER_FILE


#include <AIToolbox/MDP/Policies/PolicyInterface.hpp>

#include <AIToolbox/EpsilonPolicyInterface.hpp>


namespace AIToolbox::MDP {

    class EpsilonPolicy : public PolicyInterface, public EpsilonPolicyInterface<size_t, size_t, size_t> {

        public:

            using EpsilonBase = EpsilonPolicyInterface<size_t, size_t, size_t>;


            EpsilonPolicy(const PolicyInterface & p, double epsilon = 0.1);


            virtual Matrix2D getPolicy() const override;


        protected:

            virtual size_t sampleRandomAction() const override;


            virtual double getRandomActionProbability() const override;


            // Used to sampled random actions

            mutable std::uniform_int_distribution<size_t> randomDistribution_;

    };

}


#endif