AI-Toolbox/ExpectedSARSA_8hpp_source.html

#ifndef AI_TOOLBOX_MDP_EXPECTED_SARSA_HEADER_FILE

#define AI_TOOLBOX_MDP_EXPECTED_SARSA_HEADER_FILE


#include <stddef.h>


#include <AIToolbox/MDP/Types.hpp>

#include <AIToolbox/MDP/TypeTraits.hpp>

#include <AIToolbox/MDP/Utils.hpp>

#include <AIToolbox/MDP/Policies/PolicyInterface.hpp>


namespace AIToolbox::MDP {

    class ExpectedSARSA {

        public:

            ExpectedSARSA(QFunction & qfun, const PolicyInterface & policy, double discount = 0.0, double alpha = 0.1);


            template <IsGenerativeModel M>

            ExpectedSARSA(QFunction & qfun, const PolicyInterface & policy, const M& model, double alpha = 0.1);


            void setLearningRate(double a);


            double getLearningRate() const;


            void setDiscount(double d);


            double getDiscount() const;


            void stepUpdateQ(size_t s, size_t a, size_t s1, double rew);


            size_t getS() const;


            size_t getA() const;


            const QFunction & getQFunction() const;


            const PolicyInterface & getPolicy() const;


        private:

            const PolicyInterface & policy_;

            size_t S, A;

            double alpha_;

            double discount_;


            QFunction & q_;

    };


    template <IsGenerativeModel M>

    ExpectedSARSA::ExpectedSARSA(QFunction & qfun, const PolicyInterface & policy, const M& model, const double alpha) :

            ExpectedSARSA(qfun, policy, model.getDiscount(), alpha) {}

}

#endif