AI-Toolbox/Factored_2Bandit_2Policies_2RandomPolicy_8hpp_source.html

#ifndef AI_TOOLBOX_FACTORED_BANDIT_RANDOM_POLICY_HEADER_FILE

#define AI_TOOLBOX_FACTORED_BANDIT_RANDOM_POLICY_HEADER_FILE


#include <AIToolbox/Factored/Bandit/Policies/PolicyInterface.hpp>


namespace AIToolbox::Factored::Bandit {

    class RandomPolicy : public PolicyInterface {

        public:

            RandomPolicy(Action a);


            virtual Action sampleAction() const override;


            const Action & sampleActionNoAlloc() const;


            virtual double getActionProbability(const Action & a) const override;


        private:

            // Used to sample without allocating.

            mutable Action action_;

            // Used to sampled random actions

            mutable std::vector<std::uniform_int_distribution<size_t>> randomDistributions_;

    };

}


#endif