影响力指数
论文质量、代表作、近期表现、广度与样本量置信度综合计算
-/100
发表论文1 篇
平均评分
年均产出1.0 篇/年
AI 学术分析
Dhruv Malik
研究方向
reinforcement learning · theory · optimization · zero order · derivative-free · non-convex · convex · bandits · policy regret
reinforcement learning · theory · optimization · zero order · derivative-free · non-convex · convex · bandits · policy regret