AI-Toolbox/Bandit_2Policies_2EpsilonPolicy_8hpp_source.html

#ifndef AI_TOOLBOX_BANDIT_EPSILON_POLICY_HEADER_FILE

#define AI_TOOLBOX_BANDIT_EPSILON_POLICY_HEADER_FILE


#include <AIToolbox/Bandit/Policies/PolicyInterface.hpp>

#include <AIToolbox/EpsilonPolicyInterface.hpp>


namespace AIToolbox::Bandit {

    class EpsilonPolicy : public PolicyInterface, public EpsilonPolicyInterface<void, void, size_t> {

        public:

            using EpsilonBase = EpsilonPolicyInterface<void, void, size_t>;


            EpsilonPolicy(const PolicyInterface & p, double epsilon = 0.1);


            virtual Vector getPolicy() const override;


        protected:

            virtual size_t sampleRandomAction() const override;


            virtual double getRandomActionProbability() const override;


            // Used to sampled random actions

            mutable std::uniform_int_distribution<size_t> randomDistribution_;

    };

}


#endif