d3rlpy.algos.LinearDecayEpsilonGreedy¶

class d3rlpy.algos.LinearDecayEpsilonGreedy(start_epsilon=1.0, end_epsilon=0.1, duration=1000000)[source]¶

\(\epsilon\)-greedy explorer with linear decay schedule.

Parameters

start_epsilon (float) – Initial \(\epsilon\).
end_epsilon (float) – Final \(\epsilon\).
duration (int) – Scheduling duration.

Methods

compute_epsilon(step)[source]¶

Returns decayed \(\epsilon\).

Returns: \(\epsilon\).
Parameters: step (int) –
Return type: float

sample(algo, x, step)[source]¶

Returns \(\epsilon\)-greedy action.

Parameters

algo (d3rlpy.algos.qlearning.explorers._ActionProtocol) – Algorithm.
x (numpy.ndarray) – Observation.
step (int) – Current environment step.

Returns

\(\epsilon\)-greedy action.

Return type

Read the Docs v: v2.0.4

Versions: latest; stable; v2.0.4; v2.0.3; v2.0.2; v1.1.1; v1.1.0; v1.0.0; v0.91; v0.90; v0.80; v0.70; v0.61; v0.60; v0.51; v0.50; v0.41; v0.40; v0.32; v0.31; v0.30; v0.23; v0.22; v0.21; v0.2; v0.1

Downloads: pdf; html; epub

On Read the Docs: Project Home; Builds