AI-Toolbox/QL_8hpp_source.html

#ifndef AI_TOOLBOX_MDP_QL_HEADER_FILE

#define AI_TOOLBOX_MDP_QL_HEADER_FILE


#include <AIToolbox/MDP/Algorithms/Utils/OffPolicyTemplate.hpp>


namespace AIToolbox::MDP {

    class QL : public OffPolicyControl<QL> {

        public:

            using Parent = OffPolicyControl<QL>;


            QL(const size_t s, const size_t a, const double discount = 1.0, const double alpha = 0.1,

               const double lambda = 0.1, const double tolerance = 0.001, const double epsilon = 0.1) :

                    Parent(s, a, discount, alpha, tolerance, epsilon)

            {

                setLambda(lambda);

            }


            void setLambda(double l) {

                if ( l < 0.0 || l > 1.0 ) throw std::invalid_argument("Lambda parameter must be in [0,1]");

                lambda_ = l;

            }


            double getLambda() const { return lambda_; }


        private:

            friend Parent;

            double getTraceDiscount(const size_t, const size_t, const size_t, const double, const size_t) const {

                return lambda_;

            }


            double lambda_;

    };


    class QLEvaluation : public OffPolicyEvaluation<QLEvaluation> {

        public:

            using Parent = OffPolicyEvaluation<QLEvaluation>;


            QLEvaluation(const PolicyInterface & target, const double discount,

                    const double alpha, const double lambda, const double tolerance) :

                    Parent(target, discount, alpha, tolerance)

            {

                setLambda(lambda);

            }


            void setLambda(double l) {

                if ( l < 0.0 || l > 1.0 ) throw std::invalid_argument("Lambda parameter must be in [0,1]");

                lambda_ = l;

            }


            double getLambda() const { return lambda_; }


        private:

            friend Parent;

            double getTraceDiscount(const size_t, const size_t, const size_t, const double) const {

                return lambda_;

            }


            double lambda_;

    };

}


#endif