AI-Toolbox/PGAAPPPolicy_8hpp_source.html

#ifndef AI_TOOLBOX_MDP_PGA_APP_POLICY_HEADER_FILE

#define AI_TOOLBOX_MDP_PGA_APP_POLICY_HEADER_FILE


#include <AIToolbox/MDP/Policies/QPolicyInterface.hpp>

#include <AIToolbox/MDP/Policies/PolicyWrapper.hpp>


namespace AIToolbox::MDP {

    class PGAAPPPolicy : public QPolicyInterface {

        public:

            PGAAPPPolicy(const QFunction & q, double lRate = 0.001, double predictionLength = 3.0);


            void stepUpdateP(size_t s);


            virtual size_t sampleAction(const size_t & s) const override;


            virtual double getActionProbability(const size_t & s, const size_t & a) const override;


            virtual Matrix2D getPolicy() const override;


            void setLearningRate(double lRate);


            double getLearningRate() const;


            void setPredictionLength(double pLength);


            double getPredictionLength() const;


        private:

            double lRate_, predictionLength_;

            PolicyWrapper::PolicyMatrix policyMatrix_;

            PolicyWrapper policy_;

    };

}


#endif