Uma coisa nada tem a ver com a outra; não há escolha, são cenários de uso diferentes! Os 4 cores estão sempre activos, a diferença de velocidades em Turbo tem a ver com o número de cores usados a 100% pelo software em determinado momento! Com overclock se só tiveres 1 ocupado ao máximo atinges 4.1GHz nele, se tiveres os 4 ocupados só atinges 3.8GHz (e idem para 3 e 2 entre eles).
O Uso do Turbo sem ser overclockado (ie. sem esses +400MHz em cima) serve para que o consumo do processador seja semelhante em todos os casos, sendo o clock mais alto obtido quanto menos cores estiverem a trabalhar a 100%, para o consumo não disparar. Desta forma optimiza o uso do processador dentro de um alvo de consumo máximo, de outra forma, se tivesses uma única thread a correr num core ocupado a 100% e os outros 3 cores pouco ocupados, a performance seria mais baixa nesse programa porque não saíria dos 3.3 base em vez de subir para 3.7GHz..
Imagina que tens um tecto de consumo que não ultrapasse muito 95W, e tens o CPU stock a 3.3GHz com o Turbo ligado. Se o software só te puxar por uma thread, o core que a está a correr sobe para 3.7GHz, enquanto que os outros ficam descansados a um clock baixo porque não estão a fazer nada que exija mais. Se o software puxar por 4 threads ao mesmo tempo, todos os cores sobem até 3.4GHz. Não o poderiam fazer todos para 3.7 porque senão o consumo disparava. Idem para 3 cores que sobem para 3.5, deixando um de molho, ou 2 ocupados a subir para 3.6GHz enquanto os outros 2 ficam a pastar.
Este overclock limitado (por não teres um série K) o que faz é permitir que estes saltos de Turbo feitos sobre os 3.3GHz base que correspondem a 3.4 (para 4 cores em uso), 3.5 (para 3 cores em uso), 3.6 (para 2 cores em uso) e 3.7 (para um core em uso) tenham ainda mais 400MHz em cima.
Com um série K bastava escolheres o multiplicador máximo simultâneo para os 4 cores independentemente do cenário de uso e sem limite imposto (i.e., sem depender do Turbo), que ficavas despachado.