Comprensione dei punteggi in scala

I punteggi in scala sono un tipo di punteggio dell'esame. Sono comunemente utilizzati da società di test che gestiscono esami ad alto rischio, come esami di ammissione, certificazione e licenza. I punteggi in scala vengono utilizzati anche per i test K-12 Common Core e altri esami che valutano le capacità degli studenti e valutano i progressi dell'apprendimento.

Punteggi grezzi vs. punteggi in scala

Il primo passo per comprendere i punteggi scalati è imparare come differiscono dai punteggi grezzi. Un punteggio grezzo rappresenta il numero di domande d'esame a cui rispondi correttamente. Ad esempio, se un esame ha 100 domande e ne ottieni 80 corrette, il tuo punteggio grezzo è 80. Il tuo punteggio percentuale corretto, che è un tipo di punteggio grezzo, è dell'80% e il tuo voto è una B-.

Un punteggio in scala è un punteggio grezzo che è stato adattato e convertito in una scala standardizzata. Se il tuo punteggio grezzo è 80 (perché hai ottenuto 80 domande su 100 corrette), quel punteggio viene adattato e convertito in un punteggio in scala. I punteggi non elaborati possono essere convertiti in modo lineare o non lineare.

Esempio di punteggio in scala

ACT è un esempio di esame che utilizza la trasformazione lineare per convertire i punteggi grezzi in punteggi ridimensionati. Il seguente diagramma di conversazione mostra come i punteggi grezzi di ciascuna sezione di ACT vengono trasformati in punteggi ridimensionati. 

Raw Score English Raw Score Math Lettura del punteggio grezzo Raw Score Science Punteggio in scala
75 60 40 40 36
72-74 58-59 39 39 35
71 57 38 38 34
70 55-56 37 37 33
68-69 54 35-36 - 32
67 52-53 34 36 31
66 50-51 33 35 30
65 48-49 32 34 29
63-64 45-47 31 33 28
62 43-44 30 32 27
60-61 40-42 29 30-31 26
58-59 38-39 28 28-29 25
56-57 36-37 27 26-27 24
53-55 34-35 25-26 24-25 23
51-52 32-33 24 22-23 22
48-50 30-31 22-23 21 21
45-47 29 21 19-20 20
43-44 27-28 19-20 17-18 19
41-42 24-26 18 16 18
39-40 21-23 17 14-15 17
36-38 17-20 15-16 13 16
32-35

13-16

14 12 15
29-31 11-12 12-13 11 14
27-28 8-10 11 10 13
25-26 7 9-10 9 12
23-24 5-6 8 8 11
20-22 4 6-7 7 10
18-19 - - 5-6 9
15-17 3 5 - 8
12-14 - 4 4 7
10-11 2 3 3 6
8-9 - - 2 5
6-7 1 2 - 4
4-5 - - 1 3
2-3 - 1 - 2
0-1 0 0 0 1
Fonte: ACT.org

Il processo equivalente

Il processo di ridimensionamento crea una scala di base che funge da riferimento per un altro processo noto come equivalente. Il processo di equiparazione è necessario per tenere conto delle differenze tra più versioni dello stesso test.

Sebbene i produttori di test provino a mantenere lo stesso livello di difficoltà di un test da una versione all'altra, le differenze sono inevitabili. L'equazione consente al produttore del test di regolare statisticamente i punteggi in modo che le prestazioni medie nella versione uno del test siano uguali alle prestazioni medie nella versione due del test, nella versione tre del test e così via.

Dopo aver subito sia il ridimensionamento che l'equivalenza, i punteggi in scala dovrebbero essere intercambiabili e facilmente confrontabili, indipendentemente dalla versione del test eseguita. 

Esempio equivalente

Diamo un'occhiata a un esempio per vedere come il processo di equivalenza può influire sui punteggi in scala nei test standardizzati. Immagina di dire che tu e un amico state prendendo il SAT. Entrambi farai l'esame presso lo stesso centro di test, ma farai il test a gennaio, e il tuo amico farà il test a febbraio. Hai date di prova diverse e non vi è alcuna garanzia che entrambi prenderai la stessa versione di SAT. Puoi vedere una forma del test, mentre il tuo amico ne vede un'altra. Sebbene entrambi i test abbiano contenuti simili, le domande non sono esattamente le stesse.

Dopo aver preso il SAT, tu e il tuo amico vi riunite e confrontate i risultati. Entrambi avete ottenuto un punteggio grezzo di 50 nella sezione matematica, ma il vostro punteggio in scala è 710 e il punteggio in scala del vostro amico è 700. Il vostro amico si chiede cosa sia successo dal momento che entrambi avete corretto lo stesso numero di domande. Ma la spiegazione è piuttosto semplice; ognuno di voi ha preso una versione diversa del test e la sua versione è stata più difficile della sua. Per ottenere lo stesso punteggio in scala sul SAT, avrebbe dovuto rispondere a più domande correttamente di te.

I produttori di test che utilizzano un processo equivalente utilizzano una formula diversa per creare una scala unica per ogni versione dell'esame. Ciò significa che non esiste un grafico di conversione da punteggio grezzo a scala che può essere utilizzato per ogni versione dell'esame. Ecco perché, nel nostro esempio precedente, un punteggio grezzo di 50 è stato convertito in 710 in un giorno e 700 in un altro giorno. Tienilo a mente mentre fai i test di pratica e usi i grafici di conversione per trasformare il tuo punteggio grezzo in un punteggio in scala.

Scopo dei punteggi in scala

I punteggi grezzi sono sicuramente più facili da calcolare rispetto ai punteggi in scala. Ma le società di test vogliono assicurarsi che i punteggi dei test possano essere confrontati in modo equo e accurato anche se i partecipanti al test assumono versioni o forme diverse del test in date diverse. I punteggi scalati consentono confronti accurati e assicurano che le persone che hanno superato un test più difficile non siano penalizzate e che alle persone che hanno superato un test meno difficile non venga concesso un vantaggio ingiusto.