Explain batch size for llms to me
Peux-tu préciser ce que l’on entend par batch size dans l’inférence (et non dans l’entrainement) des llm?

Questions similaires

Related questions